Рубрика «rag» - 3

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

2026-01-11 в 11:16, admin, рубрики: Claude API, embeddings, fastapi, llm, nlp, postgresql, qdrant, rag, Text-to-SQL, чат-бот

После 10 лет внедрения BI-систем (Qlik Sense, Power BI, Data Lens) я понял одну вещь: дашборд — это не решение. Это данные для решения. А между данными и решением — пропасть, которую преодолевает человек.

В этой статье покажу, как построил RAG-систему с чат-интерфейсом для базы из 600 000 записей техники из Федресурса. Без философии — только архитектура, код и грабли.

Проблема: почему дашборды не работают

Типичный сценарий. Аналитик открывает дашборд с данными о технике в лизинге. Нужно найти топ-10 компаний с бензовозами в Московской области.

Что происходит:

Ищет нужный дашборд (их 15 штук)
Читать полностью »

Data-Feeling-School-RAG-Challenge или по ту сторону баррикад

2026-01-11 в 7:14, admin, рубрики: rag, ranker, сезон ии в разработке

Не буду одинок, если предположу, что большинство читателей при встрече с чат ботом любой ценой отказывается от его услуг, и ищет способы выхода на живого человека. Причин тому много и основная из них это выдача чат ботом информации далекой от ожидаемой. А какова цена создания системы, которая мало мальски отвечает ожидаемо на задаваемые пользователем вопросы?
В этой заметке я опишу свой опыт создании RAG системы в рамках соревнования на платформе kaggle https://www.kaggle.com/competitions/data-feeling-school-rag-challenge/overview Читать полностью »

LLM + 1C: Почему чат-бот для учета — это плохая идея, и как реализовать AI-шлюз через OData

2026-01-10 в 16:10, admin, рубрики: 1С, llm, odata, Ollama, rag, spring ai

Вводная часть: Наивная мечта

Изначально идея казалась кристально чистой: пользователь отправляет текстовый или голосовой запрос (например: «Выведи топ должников по Тверской области на текущую дату и суммы задолженности»).

Шлюз транскрибирует голос в текст (использована Java + библиотека Vosk), передает его ИИ, а тот «понимает», какие запросы нужно сделать к OData 1С, получает данные и возвращает пользователю красивый, структурированный отчет.

Для голосового ввода использовался отдельный модуль на базе VoskЧитать полностью »

AI & RAG. Помощник по техническим вопросам систем управления освещением

2026-01-10 в 12:58, admin, рубрики: AI-first, claude, frida, qdrant, qwen, rag, локальная LLM, системы управления освещением, техническая документация, эмбеддинг

Введение

Свою первую программу я написал в 1988 году на калькуляторе МК52. Очень хотелось программировать и даже максимально странный интерфейс не останавливал. Утекло почти 40 лет. Были Атари, Синклеры, 286 IBM, Интернет, смартофоны. Но все эти технологии входили как-то постепенно, приспосабливаясь и без шока.

AI ворвался в жизнь бывалого ИТшника как пыльным мешком по голове. После первого шока, скормленных Дипсику результатов анализов, идей подарков, профессиональная “чуйка” потребовала придумать новой чудо-технологии боевое применение в том, чем я занимаюсь каждый день на протяжении всей сознательной жизни.

Читать полностью »

Делай Bench: мой опыт слепого human-eval бенчмарка нейросетей для юристов

2026-01-08 в 15:01, admin, рубрики: llm, open-source llm, rag, сезон ии в разработке

Привет и с Новым годом! Меня зовут Екатерина, я практикующий юрист, исследую эффективное применение нейросетей в юридических задачах. В декабре ушедшего года я провела необычный для себя и российского LegalTech-рынка эксперимент: с помощью одиннадцати коллег-оценщиков организовала небольшоенезависимое слепое сравнение пяти нейросетевых сервисов. В этой публикации хочу рассказать о вызовах human-eval бенчмарка в домене, где зачастую нет единственно правильных ответов, интересных выводах исследования, полученной мной обратной связи и дальнейших планах.

Юристы и бенчмарки LLM

Читать полностью »

Создаем простую систему RAG на Python

2025-12-25 в 14:09, admin, рубрики: ml, rag, векторный поиск, генеративные модели, семантический поиск, эмбеддинги

Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.

Читать полностью »

Как спроектировать AI ассистента для поддержки и не слить бюджет. Часть 1: От идеи до выбора архитектуры

2025-12-10 в 9:29, admin, рубрики: AI, graphrag, llm-агент, rag, автоматизация поддержки, ии-ассистент

Каждая команда сейчас хочет заменить людей на AI. Но есть и другой подход - усилить текущие возможности с помощью AI. Это драйвер роста и масштабирования, а не повод увольнять людей.

Покажу как спроектировать AI агента который можно внедрить в продакшен и реально получить результат. Буду рассказывать на примере проектирования агента который решает проблемы юридической поддержки.

Поговорим про RAG и GraphRAG, про развёртывание и выбор модели. Статья будет полезна как для больших компаний так и для маленьких. В конце посчитаем метрики через eval (Ragas, LLM-as-a-judge), и немного про LangSmith и LangChain.

Формулируем задачу

Читать полностью »

Создание корпоративной Базы Знаний для внедрения LLM-инструментов

2025-12-09 в 15:12, admin, рубрики: knowledge bases, knowledge management, llm, rag, база знаний, внедрение ии, искусственный интеллект, цифровизация бизнес-процессов, Чат-боты

В статье описываю практический опыт построения корпоративного ИИ-ассистента: от структуры базы знаний и графовой модели до фильтрации контекста и контроля версий. Материал будет полезен продактам, архитекторам, маркетологам и всем, кто внедряет ИИ в бизнес-процессы.

«Garbage in - garbage out», как мусор в корпоративной Базе Знаний мешает корректной работе ИИ и как мы предлагаем это исправить.

Сегодня многие компании внедряют ИИ-агентов по упрощённому сценарию: загружают PDF-регламенты, Excel-прайсы и архивы переписок в векторную БД, после чего ожидают, что модель будет корректно отвечать на вопросы пользователей.Читать полностью »

Как развернуть полноценный n8n AI-стек за 15 минут, а не за целый день

2025-12-05 в 15:15, admin, рубрики: ai-агенты, devops, docker, n8n, Ollama, production, rag, self-hosted, автоматизация, векторные базы данных

Последние пару лет я активно работаю с автоматизацией и AI-агентами. Проекты разные - от чат-ботов для Telegram до сложных RAG-систем с векторными базами. И знаете, что меня всегда бесило? Каждый раз при развертывании нового проекта уходило несколько часов, а то и целый день на настройку окружения.

Сначала настраиваешь Docker Compose для n8n, потом прикручиваешь Postgres, потом вспоминаешь про Redis (потому что без него n8n в queue mode не заведешь), потом Supabase для векторов, потом Qdrant, потому что Supabase для векторов медленноват... А еще же HTTPS нужно настроить, Caddy или Nginx сконфигурировать, сертификаты получить. И так каждый раз.

Читать полностью »

Оптимальный путь в NLP: как стать Middle за полгода

2025-11-23 в 17:09, admin, рубрики: data science, ml system design, nlp, python, rag, машинное обучение, нейронные сети, обучение программированию, трансформеры

Стать Middle NLP Engineer за 6 месяцев — реально.

Не за два года, не через бесконечные курсы — а за полгода нормальной учебы.

Эта статья - про оптимальный путь. Без матана, без академизма, без «прочитай пять книг». Только то, что реально нужно для собеседований и работы.

Почему это реально:

Мой путь от нуля до стажёра занял два года, и сейчас я понимаю, как пройти его быстрее
После нахождения первой работы я вырос до Senior за год;
Я регулярно провожу собеседования и знаю реальные требования;
Уже помог нескольким людям войти в профессию.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «rag» - 3

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

Проблема: почему дашборды не работают

Data-Feeling-School-RAG-Challenge или по ту сторону баррикад

LLM + 1C: Почему чат-бот для учета — это плохая идея, и как реализовать AI-шлюз через OData

Вводная часть: Наивная мечта

AI & RAG. Помощник по техническим вопросам систем управления освещением

Введение

Читать полностью »

Делай Bench: мой опыт слепого human-eval бенчмарка нейросетей для юристов

Юристы и бенчмарки LLM

Создаем простую систему RAG на Python

Как спроектировать AI ассистента для поддержки и не слить бюджет. Часть 1: От идеи до выбора архитектуры

Формулируем задачу

Создание корпоративной Базы Знаний для внедрения LLM-инструментов

«Garbage in - garbage out», как мусор в корпоративной Базе Знаний мешает корректной работе ИИ и как мы предлагаем это исправить.

Как развернуть полноценный n8n AI-стек за 15 минут, а не за целый день

Оптимальный путь в NLP: как стать Middle за полгода