Рубрика «rag pipeline»
Ваш RAG не умеет думать. А мой умеет
2026-04-24 в 9:01, admin, рубрики: AI, graphrag, HippoRAG, rag, rag ai, rag pipeline, rag система, ruvds_статьи, исскуствоRAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний
2026-02-18 в 19:17, admin, рубрики: llm, neuron, php, qdrant, rag, rag pipeline, retrieval augmented generation, yandexgptВ этой статье покажу, как мы собрали RAG-систему на PHP и Qdrant: выбрали векторную базу и LLM, настроили гибридный поиск и реализовали чат-бота на Symfony с использованием PHP фреймворка Neuron AI.
К нам обратился клиент с задачей: сделать чат-бота для поиска информации по внутренней базе знаний (статьи, документация, корпоративные тексты). Главное требование - быстро собрать MVP, чтобы проверить гипотезу и принять решение о дальнейшем развитии системы. Первую версию запустили, получаем хорошие отзывы от пользователей, поэтому решил поделиться и, возможно, получить полезную обратную связь от сообщества.
Стек и компоненты
Часть 5. Обзор техник оценки качества систем RAG
2025-09-19 в 20:43, admin, рубрики: nlp, nlp обработка текста, rag, rag pipeline, база знаний, бенчмарки, искусственный интеллект, метрикиПредисловие переводчика
Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь, четвёртую часть — здесь). Перевод этой части мы выполняли в тандеме с коллегой — Мариной Хазиевой. К некоторым терминам, как и в прошлых частях, добавлены переводы и пояснения для удобства начинающих ИТ-переводчиков.
Свой ChatGPT на документах: делаем RAG с нуля
2025-07-13 в 10:08, admin, рубрики: ai agent, ai app, ai application, llama 3.3 70B, rag, rag ai, rag pipeline, retrieval augmented generation, ии агент, ии приложениеВсем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в Qdrant и подключим LLaMA через Amvera Inference.
Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.
Самое главное, что всё это работает самостоятельно, без зависимости от OpenAI.
RAG - что это?
Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных
2025-05-16 в 20:29, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, rag pipeline, retrieval, retrieval augmented generation, языковые моделиПродолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных.
Основы и продвинутые техники RAG
2025-01-02 в 10:00, admin, рубрики: genai, generative models, llm, machine learning, nlp, rag, rag pipelineПривет! В этом посте мы поговорим подробно про RAG на каждом его этапе, его текущее развитие на момент написания статьи и про другие модификации. В прошлой статье я писал про промптинг, советую глянуть 👀

Интро
Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM
2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели
RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.

