У вас есть PostgreSQL база, где хранится множество текстовых данных. Вы хотите использовать векторные представления (embeddings), к примеру, от OpenAI, чтобы построить систему рекомендаций, улучшенный поиск или реализовать RAG для работы с LLM. Но при этом ставить расширения (extensions) не хочется, а может, и вовсе нельзя — например, в облачных Managed PostgreSQL зачастую нет нужных прав.
Рубрика «rag»
Улучшение RAG с помощью графов знаний
2025-01-10 в 9:30, admin, рубрики: graphrag, knowledge graph, llm, Milvus, ragЗнакомство с RAG и связанными с ним проблемами
Генерация с дополненной выборкой (RAG) — это метод, который соединяет внешние источники данных для улучшения вывода больших языковых моделей (LLM). Этот метод идеально подходит для LLM для доступа к частным или специфичным для предметной области данным и решения проблем, связанных с галлюцинациями. Поэтому RAG широко используется для поддержки многих приложений GenAI, таких как чат-боты AI и Читать полностью »
RAG в действии: актуальные инструменты и возможности их применения
2025-01-09 в 9:39, admin, рубрики: AI, graphrag, ner, nlp, ragЗадумывались ли вы, кто на самом деле находится по ту сторону телефонной линии или чата? В современном мире за приятным голосом неизвестного абонента или ненавязчивым текстовым сообщением часто скрывается вовсе не человек, а искусственный интеллект. Этот робот обучен выполнять задачи маркетинга и клиентской поддержки. Но когда мы пишем негативный фидбек или выражаем свои пожелания, то надеемся если не на изменения, то хотя бы на эмоциональную реакцию. Но ИИ такой ответ — не по силам.
Всем привет, меня зовут Никита Сергиевский. Я —Читать полностью »
Основы и продвинутые техники RAG
2025-01-02 в 10:00, admin, рубрики: genai, generative models, llm, machine learning, nlp, rag, rag pipelineПривет! В этом посте мы поговорим подробно про RAG на каждом его этапе, его текущее развитие на момент написания статьи и про другие модификации. В прошлой статье я писал про промптинг, советую глянуть 👀
Интро
GraphRAG: Повышение точности и полноты GenAI
2024-12-30 в 18:03, admin, рубрики: genai, graphrag, llm, rag, генеративный ииGraphRAG предоставляет «граф знаний» LLM. В отличие от текстовых документов, эти структуры данных четко отображают взаимосвязи между объектами.
Компании применяют генеративный ИИ в широком спектре функций, включая поддержку клиентов, продажи, юридические услуги, маркетинг и многие другие. По состоянию на 2024 год Читать полностью »
RAG в техподдержке: проблемы и пути улучшения
2024-12-27 в 11:42, admin, рубрики: llm, rag, ИИ, ии чат-бот, ии-агенты, ии-ассистентТехнология RAG в последнее время получила широкое распространение в сфере техподдержки. Её основная идея заключается в том, чтобы перед генерацией ответа модель делала поиск по документации компании и добавляла найденные фрагменты в промпт. Предполагалось, что это позволит ускорить работу операторов и повысить точность ответов. Однако, как показывает практика, при использовании RAG возникает ряд ограничений и сложностей. В этой статье рассмотрим основные проблемы, влияние на метрики поддержки и возможные пути улучшения.
1. Ограничения поиска по документации
Как оценивать ваш RAG-пайплайн и валидировать качество ответов LLM
2024-12-27 в 6:14, admin, рубрики: AI, big data, llm, llm-модели, nlp, rag, rag pipeline, база знаний, искусственный интеллект, языковые моделиRAG-системы становятся все популярнее в корпоративной среде, но их эффективное внедрение и качественная оценка остается сложной задачей. Один из типичных примеров — создание чат-ботов, отвечающих на вопросы пользователей с опорой на корпоративную базу знаний. И которые, вроде бы, заводятся и работают, и делают это даже неплохо, но всегда хочется получше.
Будущее LLM: 7 прогнозов на 2025 год
2024-12-26 в 12:43, admin, рубрики: AGI, Fine-tuning, gpt, llm, llmarena, o1-preview, OpenAI, rag, искусственный интеллект«Гараж» как инкубатор инноваций и л̶о̶г̶о̶в̶о S̶k̶y̶n̶e̶t
2024-12-17 в 11:30, admin, рубрики: chatgpt, codellm, genai, localai, Ollama, OpenAI, rag, retrieval augmented generation, techradar, WhisperПривет, Хабровчане!
Меня зовут Андрей Беляев, и я занимаюсь расширением возможностей организаций, внедряя ИИ-помощников.
Сегодня я расскажу, как наша R&D-лаборатория, «лампово» называемая «Гараж», исследовала потенциал больших языковых моделей, проверяла бизнес-гипотезы и технические решения и в итоге запустила процесс создания корпоративной экосистемы GenAI, а также технологической платформы в ее основе.