В последние пару лет RAG (retrieval-augmented generation) стал одной из самых обсуждаемых технологий в области обработки текстов и поисковых систем. Его идея проста: объединить поиск (retrieval) и генерацию (generation), чтобы быстрее находить нужную информацию и создавать более точные тексты.
Рубрика «rag» - 13
Мама, у меня RAG: пути к улучшению, когда он «наивный»
2025-02-25 в 18:45, admin, рубрики: genai, graph rag, graphrag, knowledge graph, llm-модели, rag, retrival augumented generation, semantic search, ИИ и машинное обучениеПроцесс Retrieval-Augmented Generation (RAG) представляет собой довольно сложную систему, состоящую из множества компонентов. Вопрос о том, как определить существующие методы RAG и их оптимальные комбинации для выявления лучших практик, в настоящий момент остается наиболее актуальным. В этой статье я хочу поделиться своим опытом относительно реализации подходов и практик в области RAG систем, который реализует систематический подход к решению этой проблемы.
Типовые задачи процессов RAG систем
-
Классификация запросов,
-
Деление на фрагменты
-
Векторизация данных
-
Поиск,
-
Переранжирование,
DeepSeek vs Mixtral: что безопаснее использовать для корпоративного чат-бота?
2025-02-05 в 10:05, admin, рубрики: AI RedTeaming, AI Security, deepseek, llm, mixtral, ragЯзыковая модель DeepSeek R1 наделала много шума в начале этого года. Сначала в AI-сообществе с восхищением обсуждали, как китайцам удалось получить качество генерации текста на уровне передовых западных моделей при меньших затратах на обучение. Затем восторг сменился жёсткой критикой о политической предвзятости, копировании моделей OpenAI и доступности истории запросовЧитать полностью »
Взаимодействие с документами с помощью DeepSeek и Ollama: локальный чатбот RAG для диалогов с учетом контекста
2025-02-04 в 13:42, admin, рубрики: deepseek, deepseek ai, DeepSeek R1, rag
Оценка систем больших языковых моделей (LLM): метрики, проблемы и лучшие практики
2025-02-04 в 12:49, admin, рубрики: AI, llm, named entity recognition, rag, RAI, Text-to-SQL, бенчмарки
Применение технологии RAG при построении интегрированных систем для цифровых продуктов: детальный разбор
2025-02-02 в 17:26, admin, рубрики: llm, rag, архитектура RAG, векторная база данных, генерация текста, ИИ, ИИ и машинное обучение, искусственный интеллект, конвейер RAG, языковые моделиВ 2024 году популярными словами и постоянной темой для обсуждения в IT были большие языковые модели (LLM), обработка естественного языка (NLP), искусственный интеллект и создание ценностей. Однако вкатиться в эту экосистему без подготовки может быть довольно сложно. Давайте начнём с того, что рассмотрим понятие генерации с дополненной выборкой (Retrieval Augmented Generation, RAG), чтобы лучше понять эту технологию и возможность её использования в наших цифровых продуктах.
99 вкладок браузера или «Бесконечность — не предел!»
2025-01-31 в 16:15, admin, рубрики: llm, rag, интервью с клиентами, искусственный интеллект, итмо, опыт, расширения браузеров, стартап
Представьте: вы открываете браузер и... 99 вкладок, хаос, поиск той самой нужной страницы превращается в квест. Мы, команда ИИнтеграция, столкнулись с этим лично, и именно так родился HoundApp — интеллектуальный ассистент, который призван помочь навести порядок.
Всё началось с магистратуры магистратуры AI Talent Hub от ИТМО x Napoleon ITЧитать полностью »
Применение LLM + RAG для диалоговых систем в службе поддержки
2025-01-30 в 11:53, admin, рубрики: AI, llm, rag, robovoice, ИИ, техподдержкаАвтоматизация клиентской поддержки с помощью больших языковых моделей — перспективное направление, но без доработки они не всегда способны дать точные и релевантные ответы. Меня зовут Михаил Крюков, технический директор платформы Robovoice (SL Soft), и в этой статье я расскажу, как усиливать LLM с помощью RAG.
LangChain vs LlamaIndex: проектируем RAG и разбираемся, что выбрать для вашего проекта
2025-01-22 в 14:49, admin, рубрики: LangChain, llamaindex, llm, ragСегодня it-сообщество предлагает большое количество любопытных инструментов для создания RAG-систем. Среди них особенно выделяются два фреймворка — LangChain и LlamaIndex. Как понять, какой из них подходит лучше для вашего проекта? Давайте разбираться вместе!
Меня зовут София, я сотрудница компании Raft, работаю на стыке backend и ML. Сегодня мы затронем сразу несколько вопросов. План таков:
-
Обсудим, что такое RAG и зачем он нужен;
-
Рассмотрим side-by-side, как написать простую реализацию чат-бота на основе RAG с помощью каждого из фреймворков (LangChain и LlamaIndex);
