Рубрика «llm-модели» - 3

Маршрутизация LLM: оптимизация путей обработки языка

2025-11-06 в 11:30, admin, рубрики: AI, artificial intelligence, data augmentation, latency, llm, llm-модели, MTBench, маршрутизация запросов

Повышение эффективности и производительности через инновационные стратегии маршрутизации.

Что такое LLM Routing?

В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)Читать полностью »

Как мы в Авито сделали свою LLM — A-vibe

2025-10-27 в 14:17, admin, рубрики: DS, llm, llm-модели, ml, nlp

Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.
В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты.

Сегодня мы выпустили в опенсорс свое семейство генеративных моделей – A-Vibe и A-Vision, статья приурочена к этому событию.

Читать полностью »

Разработка автономного речевого тренажёра для обучения иностранным языкам на основе больших языковых моделей

2025-10-25 в 13:15, admin, рубрики: asr, cloud, llm-модели, speech recognition, speech-to-text, TTS, Yandex.Cloud

Читать полностью »

Что именно ИИ-чатботы делают «под капотом»

2025-10-21 в 17:09, admin, рубрики: llm-модели, нейросети, обработка естественного языка, токены, чат-бот

Среди друзей я пользуюсь репутацией «ты ж программист», поэтому у меня нередко интересуются, как именно работают «под капотом» такие известные инструменты как ChatGPT, Claude, Grok или DeepSeek. Со временем я отточил ответ на этот вопрос — и потому, что нашёл способы лучше на него отвечать, и потому, что научился сам создавать большую языковую модель с нуля. Поэтому и сам понимать большие языковые модели я стал гораздо лучше.

Читать полностью »

HumanDynamics: как мы построили цифровой мир, жители которого пошли в банк и взяли кредит

2025-10-16 в 9:34, admin, рубрики: ai-модель, data science, HumanDynamics, llm-агент, llm-модели, Neoflex

— Нам нужны люди.
— Какие?
— Которых не существует. Но которые живут.
— ?!

Статья Елизаветы Курочкиной, старшего специалиста по Data Science, компании Neoflex, посвящена рассказу о том, как простая задача генерации синтетических данных для банка переросла в создание фреймворка симуляции цифровой цивилизации под названием HumanDynamics.

Зачем вообще понадобилось что-то симулировать?

Одна из ключевых проблем, с которой сталкивается банковская сфера, — данныеЧитать полностью »

LLM в роли «судьи» vs. человеческая оценка: почему вместе — лучше

2025-10-14 в 11:00, admin, рубрики: AI, ai agent, genai, human in the loop, llm, llm-модели, rag, ИИ, ии-агенты, оценка моделей

В гонке за следующей волной «умных» систем большие языковые модели берут на себя неожиданные роли. Одна из самых интересных — использовать такие модели как «судей» для оценки других моделей. Подход уже экономит командам массу ручной работы, но остаются вопросы: способен ли LLM уловить каждую тонкую ошибку? Что происходит в ситуациях, где критичны человеческая интуиция или глубокая предметная экспертиза?

Читать полностью »

Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела

2025-10-08 в 19:03, admin, рубрики: AI, ai-агенты, ai-ассистент, AI-инструменты, AI-разработка, llm, llm-агент, llm-архитектура, llm-модели

(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")

Помните свой первый "вау-эффект" от LLM?

Читать полностью »

RAG на практике: как мы на базе ИИ-ассистента собрали бота для поддержки в Rocket.Chat

2025-10-02 в 11:30, admin, рубрики: json, llm-модели, n8n, Ollama, rag, Rocket.Chat, ии-ассистент, облачные сервисы, поддержка

Привет! На связи команда Рег.облака. Мы давно следим за развитием Retrieval-Augmented Generation (RAG) и хотели проверить, как эта технология работает в живых сценариях.

У нас есть ИИ-ассистент — это образ виртуальной машины с предустановленными Ollama, Open WebUI и набором моделей. Его можно развернуть в пару кликов и сразу работать с LLM в приватном окружении. Но мы решили пойти дальше и проверить, как он справится в прикладной задаче: собрать чат-бота для нашей техподдержки.

Навигация по тексту

IT-лидеры видят большой бизнес-потенциал в малых моделях ИИ

2025-10-02 в 11:00, admin, рубрики: AI, ai agent, Fine-tuning, gartner, genai, llm, llm-модели, rag, ИИ

ИТ-лидеры видят большой бизнес-потенциал в малых моделях ИИ благодаря гибкости, низкой стоимости и нацеленности на конкретные задачи малые языковые модели (SLM) лучше подходят для бизнес-специфичных приложений и вскоре могут обойти LLM по использованию в корпоративной среде.

Малые языковые модели (SLM) дают CIO больше возможностей разрабатывать специализированные, отраслевые AI-приложения, эксплуатация которых дешевле, чем систем на базе универсальных больших языковых моделей (LLM).

Читать полностью »

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

2025-10-01 в 9:00, admin, рубрики: AI, data, llm, llm-агент, llm-архитектура, llm-модели, ml, искусственный интеллект, разработка

Что будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm-модели» - 3

Маршрутизация LLM: оптимизация путей обработки языка

Что такое LLM Routing?

Как мы в Авито сделали свою LLM — A-vibe

Разработка автономного речевого тренажёра для обучения иностранным языкам на основе больших языковых моделей

Что именно ИИ-чатботы делают «под капотом»

HumanDynamics: как мы построили цифровой мир, жители которого пошли в банк и взяли кредит

Зачем вообще понадобилось что-то симулировать?

LLM в роли «судьи» vs. человеческая оценка: почему вместе — лучше

Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела

(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")

Помните свой первый "вау-эффект" от LLM?

RAG на практике: как мы на базе ИИ-ассистента собрали бота для поддержки в Rocket.Chat

Навигация по тексту

IT-лидеры видят большой бизнес-потенциал в малых моделях ИИ

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1