Рубрика «nlp» - 4

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше

2025-08-11 в 9:30, admin, рубрики: llm, ml, nlp, reinforcement learning, RL, машинное обучение

Привет!
Меня зовут Роман, я NLP-инженер в Сбере. Занимаюсь мультиагентными системами и работаю с LLM в проде. Сегодня расскажу про одну из самых интересных статей июня по версии Huggingface Daily Papers — Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning.

TL;DR

Авторы предлагают простой, но мощный метод: если первая попытка модели провалилась, она должна написать краткую саморефлексию, а затем сделать повторную попытку. Если она успешна — награду получают только токены саморефлексии.

Читать полностью »

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

2025-08-05 в 16:00, admin, рубрики: AI, idp, llm, nlp, автоматизация документооборота, искусственный интеллект, обработка документов

В прошлой статье Читать полностью »

Аналогия как базовая функция мышления

2025-08-02 в 12:00, admin, рубрики: AI, analogue, nlp

Это отрывок из большой статьи в журнале "Философские проблемы информационных технологий и киберпространства". В ней приводится критика современного теоретического представления об аналогии как структурного отображения (Д. Гентнер) с одной стороны и статистического метода получения аналогии "по контексту употребления" (Т. Миколов). Мы предлагаем иной метод получения аналогии, который основан на методе аналогии по предикатам (статья Читать полностью »

Почему LLM не мыслят как люди

2025-08-02 в 11:15, admin, рубрики: AI, llm, nlp

Читать полностью »

СontentCapture+LLM: как мы ускорили работу с неструктурированными документами

2025-07-31 в 14:30, admin, рубрики: contentcapture, llm, nlp, nlp обработка текста, обработка документов

В эпоху цифровой трансформации каждая минута работы с документами на вес золота. Юридические отделы, банки, госучреждения ежедневно обрабатывают сотни договоров, доверенностей и судебных приказов. Ручной ввод данных, поиск реквизитов и проверка сроков могут отнимать до 20 минут на документ — и это если сотрудник не отвлекся на кофе.

В нашей линейке продуктов есть универсальная IDP-платформа ContentCapture Читать полностью »

Знает ли LLM то, что знаешь ты?

2025-07-25 в 13:50, admin, рубрики: llm, nlp, python, итмо, машинное обучение

Как понять, "помнит" ли модель ваш текст?

Представьте, что у вас есть друг, который идеально завершает ваши мысли. Вы говорите: «В детстве я любил...», а он тут же продолжает: «...играть в футбол и смотреть “Смешариков”». Совпадение? Или он вас слишком хорошо знает?

Теперь представьте, что этот “друг” — языковая модель вроде GPT-4, обученная на десятках терабайт текста. Вы даёте ей фразу — и она точно угадывает продолжение. Вопрос: она действительно видела это раньше или просто хорошо обучена угадывать?

Вот тут на сцену выходит Membership Inference Attack (MIA)Читать полностью »

AFlow: как создавать мультиагентные системы без программиста

2025-07-18 в 11:35, admin, рубрики: Agentic AI, AI, llm, MCTS, nlp, ИИ, искусственный интеллект, мультиагентные системы

Привет!
Меня зовут Ярослав, я магистрант AI Talent Hub в ИТМО. Сегодня расскажу об одной из самых интересных статей ICLR 2025 — AFlow: Automating Agentic Workflow Generation.

В ней предложен подход к автоматическому созданию мультиагентных систем для решения прикладных задач с помощью LLM и алгоритма Monte Carlo Tree Search (MCTS). Разберемся, как это работает и почему это важно.

Мультиагентные системы – что это?

Читать полностью »

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

2025-07-11 в 16:12, admin, рубрики: AI, ai agent, autoprompting, generative AI, llm, nlp, автопромтинг, промптинг

Всем привет! Интересно, что на Хабре статьи по этой теме я не смог найти.

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров - 1

Читать полностью »

Готовимся к собесу: positional encodings в 2025 году

2025-07-09 в 16:44, admin, рубрики: computer vision, deeplearning, gpt, nlp, вход в it, подготовка к собеседованию, собеседование

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом.

Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

Про это почему-то не знают 80% кандидатов на интервью, хотя, казалось бы, эта информация уже давно перешла в разряд «базовой классики».

Читать полностью »

Собираем MVP product search: дообучение E5 и веб-сервис для сравнения поисковых выдач

2025-07-07 в 21:47, admin, рубрики: E5, huggingface, information retrieval, machine learning, mvp, nlp, pytorch, semantic search, streamlit, дообучение моделей

Что важнее: создать продукт, или доставить его до пользователя? Оба этапа необходимы. Сегодня обсудим второй. Как нам построить поисковую e-com систему.

Покажем, что в слово логистика товара входят сложные задачи не только: перевезти наушники из Китая в Америку, но и настройка поисковой выдачи по запросу.

Быстро соберем поисковой MVP-сервис. Дообучим модель E5 на реальных данных от Amazon. Определим метрики качества и сравним BM25, pretrain E5 и fine-tune E5. Так же взглянем глазами с отладочной информациейЧитать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «nlp» - 4

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше

TL;DR

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

Аналогия как базовая функция мышления

Почему LLM не мыслят как люди

СontentCapture+LLM: как мы ускорили работу с неструктурированными документами

Знает ли LLM то, что знаешь ты?

Как понять, "помнит" ли модель ваш текст?

AFlow: как создавать мультиагентные системы без программиста

Мультиагентные системы – что это?

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

Готовимся к собесу: positional encodings в 2025 году

Собираем MVP product search: дообучение E5 и веб-сервис для сравнения поисковых выдач