Рубрика «retrieval augmented generation»

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

2025-08-28 в 14:29, admin, рубрики: java, large language model, open AI, qdrant, retrieval augmented generation, ruvds_статьи, semantic search, spring ai, vector database, исскуственный интеллект

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot — от идеи до работающего сервиса. Без сложных формул — только чёткие объяснения и код.

Читать полностью »

Свой ChatGPT на документах: делаем RAG с нуля

2025-07-13 в 10:08, admin, рубрики: ai agent, ai app, ai application, llama 3.3 70B, rag, rag ai, rag pipeline, retrieval augmented generation, ии агент, ии приложение

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в Qdrant и подключим LLaMA через Amvera Inference.

Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

Самое главное, что всё это работает самостоятельно, без зависимости от OpenAI.

RAG - что это?

Читать полностью »

Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

2025-05-16 в 20:29, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, rag pipeline, retrieval, retrieval augmented generation, языковые модели

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных.

Читать полностью »

Обзор техник RAG: Retrieval Augmented Generation

2025-04-24 в 11:15, admin, рубрики: deeplearning, DL, large language model, llm, machinelearning, ml, natural language processing, nlp, rag, retrieval augmented generation

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.

Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.

Все полезные ссылки и материалы, на которые я опирался будут в конце.

Что такое RAG и зачем нужен

RAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

Читать полностью »

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

2025-03-22 в 11:54, admin, рубрики: chatgpt, Docling, faiss, gpt, llm, question answering, rag, retrieval augmented generation, векторный поиск, парсинг PDF

Предисловие

В этом посте я расскажу про подход, благодаря которому я занял первое место в обеих призовых номинациях и в общем SotA рейтинге.

Памятка по RAG

RAG - это инструмент, расширяющий возможности LLM через “подключение” к ней базы знаний любого размера.

Путь разработки базовой RAG системы состоит из этапов:

Читать полностью »

Как выбрать embedding модель без датасета и исторических данных

2025-02-24 в 9:15, admin, рубрики: AI, embeddings, nlp, python, rag, retrieval, retrieval augmented generation

Введение

С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными?

Выбор эмбеддинг-модели — это стратегически важное и долгосрочное решение, так как оно определяет качество поиска и производительность системы. Но этот выбор особенно сложно сделать на ранних этапах развития вашего проекта, когда данных для анализа ещё нет. При этом замена модели в будущем может оказаться дорогостоящей и ресурсозатратной.

Читать полностью »

«Гараж» как инкубатор инноваций и л̶о̶г̶о̶в̶о S̶k̶y̶n̶e̶t

2024-12-17 в 11:30, admin, рубрики: chatgpt, codellm, genai, localai, Ollama, OpenAI, rag, retrieval augmented generation, techradar, Whisper

Привет, Хабровчане!

Меня зовут Андрей Беляев, и я занимаюсь расширением возможностей организаций, внедряя ИИ-помощников.

Сегодня я расскажу, как наша R&D-лаборатория, «лампово» называемая «Гараж», исследовала потенциал больших языковых моделей, проверяла бизнес-гипотезы и технические решения и в итоге запустила процесс создания корпоративной экосистемы GenAI, а также технологической платформы в ее основе.

Читать полностью »

Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией

2024-11-22 в 5:00, admin, рубрики: llm, machine learning, natural language processing, rag, retrieval, retrieval augmented generation, transformer, Transformers

Ученые часто вдохновляется нашими или животными биологическими структурами: CNN, MLP, Backprop, и для многих других исследований можно найти сходства в реальном мире. Недавно вышла статья, которая делает то же самое, но для RAG (Retrieval-Augmented Generation). В некотором роде, это недостающая современным LLM долгосрочная память. Это понятно, а причем тут неокортекст, гиппокамп и другие сложные слова? Давайте посмотрим.

Читать полностью »

Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?

2024-09-06 в 14:33, admin, рубрики: AI, llm, nlp, rag, retrieval augmented generation, искусственный интеллект

В контексте разговоров о больших языковых моделях (LLM) все чаще возникает аббревиатура RAG – Retrieval-Augmented Generation, или если переводить на русский язык, то «поисковая дополненная генерация». В этом тексте попробуем в общих чертах разобраться, как работает RAG, и где он может быть применим на практических задачах.

Дисклеймер: это вольный перевод поста с портала Medium, который написал Сахин Ахмед. Перевод подготовила редакция «Технократии». Чтобы не пропустить анонс новых материалов подпишитесь на Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «retrieval augmented generation»

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Свой ChatGPT на документах: делаем RAG с нуля

RAG - что это?

Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Обзор техник RAG: Retrieval Augmented Generation

Что такое RAG и зачем нужен

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Предисловие

Памятка по RAG

Путь разработки базовой RAG системы состоит из этапов:

Как выбрать embedding модель без датасета и исторических данных

Введение

«Гараж» как инкубатор инноваций и л̶о̶г̶о̶в̶о S̶k̶y̶n̶e̶t

Hippo-RAG: Долговременная память для LLM, вдохновленная нейробиологией

Что такое Retrieval-Augmented Generation (RAG) в языковых моделях и как оно работает?