Привет, чемпионы! Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. С 2023 года и особенно в 2025-м они вкатились в тему искусственного интеллекта (ИИ) и машинного обучения (ML) по полной. Всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию заданий — теперь почти полностью берёт на себя ИИ. Вот как это работает и почему это круто.
Рубрика «machinelearning»
Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу
2025-05-08 в 8:48, admin, рубрики: data science, datafeeling, duolingo, machinelearningЮнит тесты роя агентов
2025-05-04 в 10:44, admin, рубрики: AI, javascript, jest, llm, machinelearning, mock, OpenAI, python, TypeScript, unit-testingИсходный код, разобранный в статье, опубликован в этом репозитории
При разработке роя агентов встает вопрос юнит тестирования. Рой агентов позволяет использовать разные LLM с выбором другой активной модели исходя из действий пользователя. Как следствие, обрабатывать идентичную переписку может любой агент из роя, например, был сделан Redis FLUSHALL и активный агент потерялся: чат продолжается с корневого Triage agent
Как мы в Авито предсказываем категории объявлений по описанию
2025-04-25 в 9:30, admin, рубрики: AutoML, labeling, machinelearning, ml, mlops, nlpПривет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито, руковожу командой платформы Item2param. Одна из моих задач — развивать модели, которые предсказывают параметры объявлений. В этой статье расскажу, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой Data Science.
Обзор техник RAG: Retrieval Augmented Generation
2025-04-24 в 11:15, admin, рубрики: deeplearning, DL, large language model, llm, machinelearning, ml, natural language processing, nlp, rag, retrieval augmented generationРассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.
Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.
Все полезные ссылки и материалы, на которые я опирался будут в конце.
Что такое RAG и зачем нужен
RAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.
Запуск ML-экспериментов через ClearML
2025-04-18 в 12:26, admin, рубрики: artificial intelligence, artificial neural network, clearml, machinelearningПривет, товарищи! В предыдущем посте я рассказывал, зачем нужен менеджер ML-экспериментов, поговорили про базовый функционал ClearML. А теперь мы рассмотрим, как можно создавать эксперименты, их настраивать, ставить в очередь и запускать прям из веб-браузера. Кроме того, возникает необходимость автоматически обучать/переобучать модель по расписанию. Для того, чтобы это осуществить в ClearML существуют 2 ключевых концепта:
Воркеры и очереди
Для запуска эксперимента по обучению или тестированию его нужно сначала поставить в очередь Читать полностью »
Рекомендательная система для вашего каталога научных работ (и не только!)
2025-04-15 в 17:37, admin, рубрики: machinelearning, ml, nlp, python, обработка естественного языка, рекомендательная система, теория графовИспользуем обработку естественного языка и теорию графов для сравнения и рекомендации различных типов документов.
Введение
Почти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.
Когда обучение не идет. Loss is NaN. Причины и решения
2025-04-13 в 17:35, admin, рубрики: AI, loss, loss function, loss-функции, machinelearning, mlПривет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.
Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.
Взрыв градиента
Существует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:Читать полностью »
Как LLM выучивают факты и почему они галлюцинируют?
2025-04-13 в 8:40, admin, рубрики: AIResearch, DeepMind, HallucinationsInAI, KnowledgeAcquisition, llm, machinelearning🔥Не пропустите важные обновления и углубленные материалы!🔥
Хотите быть в курсе самых свежих обзоров и исследований в мире ML и AI? Переходите по ссылкам ниже, чтобы получить доступ к эксклюзивному контенту:
📌 Глубокий обзор с математической формализацией ждет вас на нашей странице GitHub Pages 🐙
📌 Все обзоры и аудио подкасты также доступны в нашем Telegram канале TheWeeklyBrief 📢
Не упустите шанс глубже погрузиться в мир технологий! 🚀
Содержание
-
Введение
-
Трехфазный процесс обучения
Состояние моделей рассуждения LLM
2025-03-13 в 4:15, admin, рубрики: artificial intelligence, machinelearning, искусственный интеллект, машинное обучениеЧасть 1: Методы масштабирования вычислительной мощности во время вывода
Улучшение способностей к рассуждению больших языковых моделей (LLM) стало одной из самых обсуждаемых тем в 2025 году – и не без оснований. Улучшенные навыки рассуждения позволяют моделям решать более сложные задачи, что делает их полезными в самых разных областях, интересных пользователям.
AI Engineering vs ML Engineering: Как фундаментальные модели меняют подход к разработке
2025-03-09 в 14:24, admin, рубрики: AI, artificial intelligence, machine learning, machinelearning, mlВ эпоху, когда ИИ проникает в каждый сектор, понимание различий между AI Engineering и ML Engineering становится ключевым для выбора стратегии разработки. Книга AI Engineering: Building Applications with Foundation Models ярко иллюстрирует, как фундаментальные модели (foundation models) переворачивают традиционные подходы. Вот что важно знать.
Почему сегодня AI Engineering вытесняет ML Engineering?
-
Демократизация доступа к ИИ
— Раньше: Создание ML‑моделей требовало месяцев работы с raw data, обучения архитектур и настройки гиперпараметров. Например, обучение GPT-3 потребовало 3,5 тыс. GPU‑лет.
— СейчасЧитать полностью »