Рубрика «ragas»

Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 1]

2026-05-12 в 7:15, admin, рубрики: rag, ragas, агенты ии, тестирование приложений

Доброго времени суток!

Хочется поговорить об одной из самых «больных» тем в современной AI-разработке — как проверить, что система работает правильно. :-)

Удивительно, но текущий хайп вокруг LLM привел к довольно значительной деградации инженерной культуры в этой области («в среднем по больнице»). В эпоху первых трансформеров (да и более ранние эпохи) ни у кого не возникало сомнений: нужен «Golden Set», ручная разметка и жесткий контроль метрик. NLP был уделом специалистов по машинному обучению.

Читать полностью »

RAG Testing: как не сломать retrieval

2026-02-20 в 4:15, admin, рубрики: ai quality, AI safety, DeepEval, llm testing, promptfoo, rag, ragas

TL;DR: Шесть метрик RAGAS + Precision@K/Recall@K/MRR позволяют поймать деградацию RAG-системы до того, как пользователи заметят галлюцинации. В этой статье будет всё от pip install ragas до автоматических проверок в CI/CD, включая security-тесты на document poisoning.

Проблема

RAG ломается не так, как обычный LLM. У голой языковой модели одна поверхность отказа: генерация. Модель галлюцинирует, отвечает невпопад, игнорирует инструкции. У RAG-системы таких поверхностей две: retrieval и generation. И они ломаются по-разному.

Читать полностью »

RAG+Ragas: учим AI-помощника учить без галлюцинаций

2025-11-16 в 15:17, admin, рубрики: ai-помощник, rag, ragas, онлайн-курсы

Представьте ситуацию: вы прошли онлайн-курс, начинаете применять знания на практике, но что-то не получается и надо вернуться в учебные материалы, найти, где про это что-то рассказывали. Что будете делать: пролистывать все уроки (а их может быть пара десятков), писать куратору (а он может ответить через сутки)?

Читать полностью »

Тестирование качества работы RAG. Описание и сравнение метрик

2025-10-08 в 6:00, admin, рубрики: AI, rag, ragas, искусственный интеллект, тестирование

В современном мире часто встречаются задачи с большим объемом данных, выполнение которых либо невозможно, либо сложно или затратно по времени/ресурсам автоматизировать обычными функциями и методами.

Одним из способов решения для таких случаев является применение AI с использованием RAG.

В этой статье мы постарались привести метрики для оценки качества работы подобных решений.

RAG (Retrieval Augmented Generation) - генерация ответов с использованием внешнего источника данных.

Читать полностью »

5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году

2024-12-10 в 9:30, admin, рубрики: arize ai, DeepEval, llm, mlflow, rag, ragas

Коротко о главном

«У меня такое чувство, что решений для оценки LLM больше, чем проблем, связанных с их оценкой», — сказал Дилан, руководитель отдела ИИ в компании из списка Fortune 500.

Читать полностью »

Руководство для начинающих по оценке конвейеров RAG с использованием RAGAS

2024-12-06 в 10:04, admin, рубрики: COQA-QUAC, llm, mdd, rag, ragas

Введение

В постоянно развивающемся мире машинного обучения и искусственного интеллекта разработка приложений языковых моделей, в частности систем генерации дополненного извлечения (RAG Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «ragas»

Инженерия качества: Как перестать надеяться на удачу и начать измерять своих ИИ-агентов [Часть 1]

RAG Testing: как не сломать retrieval

Проблема

RAG+Ragas: учим AI-помощника учить без галлюцинаций

Тестирование качества работы RAG. Описание и сравнение метрик

5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году

Коротко о главном

Руководство для начинающих по оценке конвейеров RAG с использованием RAGAS

Введение