Рубрика «machinelearning» - 3

Оптимизация нейронных сетей для AI — переводчика

2025-06-09 в 11:18, admin, рубрики: AI, deeplearning, language model, machinelearning, translator, искусственный интеллект, машинный перевод, нейросети, языковые модели

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи.

В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.

Читать полностью »

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

2025-05-24 в 21:25, admin, рубрики: data science, datafeeling, duolingo, machinelearning, RDS, Recovering Difference Softmax

Привет, чемпионы! Алгоритм Recovering Difference Softmax (RDS) – это не просто очередной метод машинного обучения Читать полностью »

NEAT. Основы

2025-05-21 в 17:58, admin, рубрики: machine learning, machinelearning, ml, neat, Алгоритмы, искусственный интеллект, нейоросеть, нейросети, нейроэволюционные алгоритмы, эволюция

Введение

Сегодня "теорию" NEAT, который появился в далёком 2004-м году, но при этом остается мейнстримом среди нейроэволюционных алгоритмов. Мы разберём классический вариант, так как это основа и все остальные варианты(CoDeepNEAT, HyperNEAT и т.д.) будут намного сложнее в имплементации, то есть шанс применить за разумное время обычному человеку очень мал и понять их без изначального варианта представляется почти невозможным.

NEAT - алгоритм расширяющихся топологий, то есть может развивать не только веса, но и саму структуруЧитать полностью »

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу

2025-05-08 в 8:48, admin, рубрики: data science, datafeeling, duolingo, machinelearning

Привет, чемпионы! Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. С 2023 года и особенно в 2025-м они вкатились в тему искусственного интеллекта (ИИ) и машинного обучения (ML) по полной. Всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию заданий — теперь почти полностью берёт на себя ИИ. Вот как это работает и почему это круто.

Читать полностью »

Юнит тесты роя агентов

2025-05-04 в 10:44, admin, рубрики: AI, javascript, jest, llm, machinelearning, mock, OpenAI, python, TypeScript, unit-testing

Исходный код, разобранный в статье, опубликован в этом репозитории

При разработке роя агентов встает вопрос юнит тестирования. Рой агентов позволяет использовать разные LLM с выбором другой активной модели исходя из действий пользователя. Как следствие, обрабатывать идентичную переписку может любой агент из роя, например, был сделан Redis FLUSHALL и активный агент потерялся: чат продолжается с корневого Triage agent

Читать полностью »

Как мы в Авито предсказываем категории объявлений по описанию

2025-04-25 в 9:30, admin, рубрики: AutoML, labeling, machinelearning, ml, mlops, nlp

Привет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито, руковожу командой платформы Item2param. Одна из моих задач — развивать модели, которые предсказывают параметры объявлений. В этой статье расскажу, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой Data Science.

Читать полностью »

Обзор техник RAG: Retrieval Augmented Generation

2025-04-24 в 11:15, admin, рубрики: deeplearning, DL, large language model, llm, machinelearning, ml, natural language processing, nlp, rag, retrieval augmented generation

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.

Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.

Все полезные ссылки и материалы, на которые я опирался будут в конце.

Что такое RAG и зачем нужен

RAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

Читать полностью »

Запуск ML-экспериментов через ClearML

2025-04-18 в 12:26, admin, рубрики: artificial intelligence, artificial neural network, clearml, machinelearning

Привет, товарищи! В предыдущем посте я рассказывал, зачем нужен менеджер ML-экспериментов, поговорили про базовый функционал ClearML. А теперь мы рассмотрим, как можно создавать эксперименты, их настраивать, ставить в очередь и запускать прям из веб-браузера. Кроме того, возникает необходимость автоматически обучать/переобучать модель по расписанию. Для того, чтобы это осуществить в ClearML существуют 2 ключевых концепта:

Воркеры и очереди

Для запуска эксперимента по обучению или тестированию его нужно сначала поставить в очередь Читать полностью »

Введение

Почти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.

Читать полностью »

Когда обучение не идет. Loss is NaN. Причины и решения

2025-04-13 в 17:35, admin, рубрики: AI, loss, loss function, loss-функции, machinelearning, ml

Привет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.

Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.

Взрыв градиента

Существует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «machinelearning» - 3

Оптимизация нейронных сетей для AI — переводчика

Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее

NEAT. Основы

Введение

Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу

Юнит тесты роя агентов

Как мы в Авито предсказываем категории объявлений по описанию

Обзор техник RAG: Retrieval Augmented Generation

Что такое RAG и зачем нужен

Запуск ML-экспериментов через ClearML

Воркеры и очереди

Рекомендательная система для вашего каталога научных работ (и не только!)

Введение

Когда обучение не идет. Loss is NaN. Причины и решения

Взрыв градиента