Рубрика «rag pipeline»

Ваш RAG не умеет думать. А мой умеет

2026-04-24 в 9:01, admin, рубрики: AI, graphrag, HippoRAG, rag, rag ai, rag pipeline, rag система, ruvds_статьи, исскуство

Привет!

Читать полностью »

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

2026-02-18 в 19:17, admin, рубрики: llm, neuron, php, qdrant, rag, rag pipeline, retrieval augmented generation, yandexgpt

В этой статье покажу, как мы собрали RAG-систему на PHP и Qdrant: выбрали векторную базу и LLM, настроили гибридный поиск и реализовали чат-бота на Symfony с использованием PHP фреймворка Neuron AI.

К нам обратился клиент с задачей: сделать чат-бота для поиска информации по внутренней базе знаний (статьи, документация, корпоративные тексты). Главное требование - быстро собрать MVP, чтобы проверить гипотезу и принять решение о дальнейшем развитии системы. Первую версию запустили, получаем хорошие отзывы от пользователей, поэтому решил поделиться и, возможно, получить полезную обратную связь от сообщества.

Стек и компоненты

Читать полностью »

Часть 5. Обзор техник оценки качества систем RAG

2025-09-19 в 20:43, admin, рубрики: nlp, nlp обработка текста, rag, rag pipeline, база знаний, бенчмарки, искусственный интеллект, метрики

Предисловие переводчика

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь, четвёртую часть — здесь). Перевод этой части мы выполняли в тандеме с коллегой — Мариной Хазиевой. К некоторым терминам, как и в прошлых частях, добавлены переводы и пояснения для удобства начинающих ИТ-переводчиков.

Читать полностью »

Свой ChatGPT на документах: делаем RAG с нуля

2025-07-13 в 10:08, admin, рубрики: ai agent, ai app, ai application, llama 3.3 70B, rag, rag ai, rag pipeline, retrieval augmented generation, ии агент, ии приложение

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в Qdrant и подключим LLaMA через Amvera Inference.

Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

Самое главное, что всё это работает самостоятельно, без зависимости от OpenAI.

RAG - что это?

Читать полностью »

Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

2025-05-16 в 20:29, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, rag pipeline, retrieval, retrieval augmented generation, языковые модели

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных.

Читать полностью »

Основы и продвинутые техники RAG

2025-01-02 в 10:00, admin, рубрики: genai, generative models, llm, machine learning, nlp, rag, rag pipeline

Привет! В этом посте мы поговорим подробно про RAG на каждом его этапе, его текущее развитие на момент написания статьи и про другие модификации. В прошлой статье я писал про промптинг, советую глянуть 👀

Интро

Читать полностью »

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM

2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые модели

RAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «rag pipeline»

Ваш RAG не умеет думать. А мой умеет

RAG на PHP + Qdrant: быстрый MVP для внутренней базы знаний

Стек и компоненты

Часть 5. Обзор техник оценки качества систем RAG

Предисловие переводчика

Свой ChatGPT на документах: делаем RAG с нуля

RAG - что это?

Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Основы и продвинутые техники RAG

Интро

Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM