Где мы все? Судя по классическому циклу зрелости, Large Language Models (LLM) уверенно маршируют к вершине «Пика завышенных ожиданий». Энтузиазм бьёт ключом: каждый день – новые анонсы и инвестиции. Как руководитель отдела инновационных проектов в «Первой грузовой компании», я вижу этот ажиотаж и сам погружен в изучение потенциала LLM для нашей отрасли. Иллюзия всесильности ИИ сейчас сильна как никогда. Мы сейчас явно находимся на пике завышенных ожиданий.
Рубрика «Few-shot»
ИИ на подъёме: восхождение к пику ожиданий и первые уроки в реальном бизнесе
2025-07-24 в 13:24, admin, рубрики: Few-shot, llm, one-shot learning, rag, бизнес-процесс, ИИ, ИИ и машинное обучение, ии чат-бот, ии-агенты, ии-ассистентСобственный контент-фильтр на базе LLM: от эксперимента до стабильной системы
2025-06-27 в 15:23, admin, рубрики: AI, false positive, Few-shot, filter, llm, фильтр контентаПривет! Меня зовут Миша Мартьянов, я инженер по исследованиям и разработке в red_mad_robot. Моя работа — искать новые идеи, проверять гипотезы и улучшать продукты. На этом пути иногда приходится изобретать уникальные решения. Например, мы создали собственный фильтр, чтобы отсеивать нежелательный контент с помощью LLM. Рассказываю, как мы к этому пришли и с какими сложностями столкнулись.
Zero-shot и Few-shot Learning в NLP
2025-04-04 в 13:15, admin, рубрики: Few-shot, Fine-tuning, nlp, Zero-shot, Zero-shot и Few-shot Learning в NLP, Zero-shot или Few-shotОпределения
Zero-shot Learning (ZSL) - это способность модели выполнять задачи без каких-либо примеров обучения. Она делает это за счёт обобщённых знаний, полученных во время предобучения.
Few-shot Learning (FSL) - это метод, при котором модели предоставляется всего несколько примеров (обычно от 1 до 5), чтобы лучше понять структуру задачи.
Архитектура
Zero-shot и Few-shot Learning реализуются в трансформерных архитектурах (GPT, Mistral, LLaMA и тд.) за счёт трех основных внутренних механизмов:
-
Предобученные эмбеддинги: модель уже имеет какие либо знания.
-
Контекстное внимание (Self-Attention): позволяет адаптироваться к входным данным.
