Рубрика «машинное обучение» - 22

RAG: борьба с низким качеством ответов в условия экономии памяти на GPU

2025-04-10 в 15:37, admin, рубрики: baseline, natural language processing, rag, искусственный интеллект, машинное обучение, чанки

Привет! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы начинаем серию статей, в которой я расскажу о том, как мы с командой разрабатывали ИИ-помощника, а также приведу практические кейсы по улучшению точности ответов с минимальными затратами памяти графических процессоров.

Как вы уже могли догадаться, наш ИИ-помощник разработан на основе RAG (Retrieval-Augmented Generation) системы. Хотя принцип работы RAG многим уже знаком и не вызывает того самого «вау», я всё же кратко напомню, как эта система работает, почему она так популярна и почему её ответам можно доверять.

Читать полностью »

Зачем моему бизнесу нейросети: гайд для не-программистов

2025-04-10 в 12:54, admin, рубрики: gpt, автоматизация бизнеса, бизнес, ИИ, машинное обучение, нейросеть, разработка

Как мне применить нейросети в своем бизнесе?

Если ваша область деятельности напрямую не связана с разработкой, то этот вопрос легко может поставить вас в тупик. Действительно – из каждого утюга трубят про новые удивительные технологии и их достижения, а как их использовать, не ясно.

На днях я общался с человеком, который огорченно рассказывал, что нейросеть (так он назвал ChatGPT) не справляется даже с самой простой задачей (найти в интернете все доступные стиралки и отсортировать их по техническим характеристикам из документации). Дескать для человека это было бы не сложно, так пусть робот этим занимается.

Читать полностью »

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

2025-04-09 в 12:00, admin, рубрики: deep learning, DL, ml, selectel, глубокое обучение, ИИ, искусственный интеллект, машинное обучение, познавательное

Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в ~~руку~~ пальцы Ctrl/Cmd+F и начинаем раскопки!Читать полностью »

Обратное распространение ошибки… на пальцах… без формул

2025-04-06 в 8:16, admin, рубрики: математика на пальцах, математика нейросетей, машинное обучение, нейросети python, нейросети и machine learning, обратное распространение ошибки, обучение нейронных сетей, обучение нейросетей, производная, производная сложной функции

Хотелось быпоказать «суть» метода обратного распространения ошибки (Backpropagation) в нейросетях. Ведь ее сложно увидеть за нагромождением формул. Статья, конечно, не для профессионалов индустрии и математиков... Но знать производные нужно.

Читать полностью »

Как я делал голосового ассистента на NLP и не сошел с ума

2025-04-05 в 16:38, admin, рубрики: nlp, OpenAI, python, Whisper, голосовой ассистент, машинное обучение, распознавание речи, синтез речи

Голосовые ассистенты давно перестали быть просто игрушкой — теперь это полноценные цифровые помощники, которые умеют общаться, искать информацию и даже шутить (иногда лучше некоторых людей). В этой статье разберём, как собрать своего кастомного ассистента с нуля на Python, используя современные NLP-инструменты. Без Siri, без Alexa, всё своё, родное.

Читать полностью »

Применение роя агентов в криптовалютном телеграм боте

2025-03-30 в 15:18, admin, рубрики: Binance, data science, javascript, python, TypeScript, блокчейн, искуственный интеллект, Криптовалюты, машинное обучение, трейдинг

Исходный код, разобранный в статье, опубликован в этом репозитории

OpenAI развивает технологию роя агентов искусственного интеллекта, активная LLM модель переключается исходя из контекста поставленной задачи. Например, когда холодный контакт написал в личку телеграм, общение идёт приветливо и многословно, как только речь идет непосредственно о покупке товара, другая модель говорит минимально по делу

Читать полностью »

DAPO: RL-алгоритм от ByteDance

2025-03-30 в 9:11, admin, рубрики: искусственный интеллект, машинное обучение

📌 Переходите по ссылке: GitHub Pages, что бы получить доступ к более подробному обзору.

Аннотация

В данной работе представлена система DAPO (Decoupled Clip and Dynamic sAmpling Policy Optimization)Читать полностью »

Большие языковые модели как инструмент для анализа технической документации и решения ИТ-инцидентов

2025-03-27 в 21:19, admin, рубрики: chatgpt, llm, документация, инцидент, машинное обучение, нейросеть

Любой инженер, сталкивавшийся с инцидентами в ИТ-системах, знает: решение часто есть в документации. Проблема в том, что найти его — как искать иголку в стоге сена. Документация объёмная, разрозненная, специфичная и написана далеко не всегда для людей. Время идёт, SLA поджимает.

Но что если бы у нас был помощник, который мгновенно читал бы всю документацию, понимал бы контекст сбоя и предлагал конкретные рекомендации? Сегодня это возможно — благодаря большим языковым моделям (LLM), таким как GPT-4, Claude, Gemini и другим.

Читать полностью »

Как дистилляция меняет индустрию искусственного интеллекта

2025-03-25 в 12:00, admin, рубрики: AI, искусственный интеллект, машинное обучение, языковые модели

Всем привет! Меня зовут Миша, я руковожу центром R&D Big Data в МТС Диджитал. В прошлый раз делился с вами подборкой книг по базам данных. Сегодня хочу обсудить, как дистилляция влияет на индустрию ИИ.

Читать полностью »

Cohere Command — революция, которую мы пропустили

2025-03-21 в 16:56, admin, рубрики: cohere, javascript, llm, lmstudio, Ollama, OpenAI, python, TypeScript, искусственный интеллект, машинное обучение

Исходный код, разобранный в данной статье, опубликован в этом репозитории

Длительный промежуток времени я искал модель, специально заточенную под вызов инструментов для внешних интегираций. Критерием поиска являлось минамальное колличество галлюцинаций при использовании железа с потребительского рынка

https://huggingface.co/tripolskypetr/command_r_gguf

Информация

Комментарии

Рекомендуем

Рубрика «машинное обучение» - 22

RAG: борьба с низким качеством ответов в условия экономии памяти на GPU

Зачем моему бизнесу нейросети: гайд для не-программистов

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Обратное распространение ошибки… на пальцах… без формул

Как я делал голосового ассистента на NLP и не сошел с ума

Читать полностью »

Применение роя агентов в криптовалютном телеграм боте

DAPO: RL-алгоритм от ByteDance

Аннотация

Большие языковые модели как инструмент для анализа технической документации и решения ИТ-инцидентов

Как дистилляция меняет индустрию искусственного интеллекта

Cohere Command — революция, которую мы пропустили