Привет, Habr!
Эта статья — первый шаг в серии материалов о технологии RAG. Здесь мы разберёмся, что это вообще такое, зачем она появилась и почему её так часто требуют в вакансиях. К концу статьи у вас должно сложиться целостное понимание, когда RAG действительно нужен, какие архитектуры бывают и где чаще всего возникают ошибки.
В статье мы разберём:
-
почему вообще появился RAG;
-
что такое RAG в общем смысле;
-
основные способы расширения контекста модели;
-
кому RAG действительно нужен (и кому нет);
-
как устроен RAG и как работает в принципе;
-
где и почему RAG чаще всего ломается;
