Рубрика «rag» - 2

Оптимальный путь в NLP: как стать Middle за полгода

2025-11-23 в 17:09, admin, рубрики: data science, ml system design, nlp, python, rag, машинное обучение, нейронные сети, обучение программированию, трансформеры

Стать Middle NLP Engineer за 6 месяцев — реально.

Не за два года, не через бесконечные курсы — а за полгода нормальной учебы.

Эта статья - про оптимальный путь. Без матана, без академизма, без «прочитай пять книг». Только то, что реально нужно для собеседований и работы.

Почему это реально:

Мой путь от нуля до стажёра занял два года, и сейчас я понимаю, как пройти его быстрее
После нахождения первой работы я вырос до Senior за год;
Я регулярно провожу собеседования и знаю реальные требования;
Уже помог нескольким людям войти в профессию.

Читать полностью »

Джейн — AI-ассистент преподавателя урбанистики: как мы создали помощника для ИТМО за 10 дней

2025-11-19 в 13:00, admin, рубрики: llm, ml, rag, ассистент, ИИ, искусственный интеллект, образование, университет, урабанистика, хакатон

Привет! Мы — команда StreetCode. На хакатоне AI Product Hack [AI]ducation мы решили проверить, может ли AI не просто помогать студентам, а понимать контекст академической дисциплины. Так появился Джейн — AI-ассистент преподавателя урбанистики, созданный для Университета ИТМО.

За десять дней мы прошли путь от идеи до работающего прототипа: сформулировали гипотезу, построили RAG-архитектуру, внедрили систему проверки безопасности и протестировали бота на реальных студенческих работах.
В этой статье расскажем, какую проблему мы решали, как устроен ассистент изнутри и что показали на финале хакатона.

Читать полностью »

Пример реализации агентного RAG’а

2025-11-16 в 18:31, admin, рубрики: AI, data science, encoder, llm, MCP, mcp-server, rag, tools

Надеюсь, все знают что такое RAG :) Для тех, кто не знает: это такая система, которая позволяет искать информацию и отвечать на вопросы по внутренней документации.

Архитектура RAG может быть как очень простой, так и весьма замысловатой. В самом простом виде она состоит из следующих компонентов:

Векторное хранилище — хранит документы в виде чанков - небольших фрагментов текста.
Ретривер — механизм поиска. Получает на вход искомую строку и ищет в векторном хранилище похожие на нее чанки (по косинусному сходству).
Читать полностью »

RAG+Ragas: учим AI-помощника учить без галлюцинаций

2025-11-16 в 15:17, admin, рубрики: ai-помощник, rag, ragas, онлайн-курсы

Представьте ситуацию: вы прошли онлайн-курс, начинаете применять знания на практике, но что-то не получается и надо вернуться в учебные материалы, найти, где про это что-то рассказывали. Что будете делать: пролистывать все уроки (а их может быть пара десятков), писать куратору (а он может ответить через сутки)?

Читать полностью »

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер

2025-11-15 в 17:02, admin, рубрики: embeddings, llm, llm-агент, neuron, php, rag, rag ai, rag_api, Vectorization

RAG (Retrieval-Augmented Generation или генерация, дополненная поиском) - это метод искусственного интеллекта, сочетающий генеративную большую языковую модель (LLM) с внешней базой знаний для создания более точных, контекстно-зависимых и актуальных ответов. Принцип его работы заключается в том, что сначала извлекается релевантная информация из набора документов или источников данных, а затем эта информация передается в LLM для формирования окончательного ответа. Этот процесс позволяет модели выдавать более точные ответы, менее подверженные “галлюцинациям”, и ее можно обновлять без дорогостоящего переобучения.

Читать полностью »

Rise of RAG: от плоских векторов к темпоральным графам в юридическом домене

2025-11-07 в 13:59, admin, рубрики: rag, база знаний, графы, эмбеддинги, юриспруденция

Читать полностью »

Когда фантастика 1939 года становится реальностью 2025-го

2025-11-01 в 8:29, admin, рубрики: bipedal locomotion, llm, rag, vla, vlm, искусственный интеллект, научная фантастика, онтология, робототехника, роботы

Вчера вечером я впервые после детства взяла в руки рассказ «Я, робот» Эндо Биндера, опубликованный в январе 1939 года в журнале Amazing Stories.Именно Эндо Биндера (псевдоним братьев Эрла и Отто Биндеров) — а не Айзека Азимова. Это тот самый рассказ, чьё название Азимов «позаимствовал» одиннадцать лет спустя для своего знаменитого сборника 1950 года, причём сам Азимов протестовал против этого решения издателя, понимая, что название уже занято. А фильм 2004 года с Уиллом Смитом сняли по мотивам азимовского цикла о Трёх законах роботехники, так что связь с оригинальным рассказом Биндера только в названии.

Читать полностью »

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

2025-10-31 в 8:12, admin, рубрики: AI, embeddings, large language model, qdrant, rag

Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода (например, SQL или Python) и англоязычной терминологии.

Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки:

Умение распознать тематику близких по значению русских слов (омонимы);
Читать полностью »

Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain

2025-10-29 в 12:16, admin, рубрики: AI, chromadb, gpt-4o mini, llm, OCR-технологии, python, rag, telegrambot, tool_calling, медицина

🚀 Идея, Которая Важнее Кода

Мой отец — человек, переживший несколько сложнейших операций на сердце. Жизнь с хроническим заболеванием — это бесконечный поток анализов, заключений и схем приёма лекарств. Находясь далеко (я живу во Вьетнаме), я постоянно волновался: не забудет ли он про дозу, правильно ли понял назначение, задал ли все нужные вопросы врачу?

Мне нужен был не просто бот-напоминалка, а второй пилот — умный, конфиденциальный и мультимодальный AI-Кардиолог. Ассистент, который знает его анамнез наизусть, понимает голосовые команды и может "прочитать" фотографию свежего анализа.

Читать полностью »

Краткий обзор 10 локальных UI для LLM

2025-10-24 в 17:03, admin, рубрики: agents, data science, huggingface, llm, nlp, Ollama, rag, tools

Если вы хотите поиграться с LLM у вас есть несколько вариантов: можно задействовать LLM через код, можно воспользоваться чатом одного из облачных провайдеров, а можно развернуть у себя UI-клиента для работы с LLM. Их довольно много. И функционал у них может сильно различаться. В самом простом виде есть только чат. У наиболее продвинутых есть встроенные базы знаний, работа с изображениями и много других функций.

Ниже краткий обзор 9 таких клиентов (отсортированы по предпочтению автора):

Информация

Комментарии

Рекомендуем

Рубрика «rag» - 2

Оптимальный путь в NLP: как стать Middle за полгода

Джейн — AI-ассистент преподавателя урбанистики: как мы создали помощника для ИТМО за 10 дней

Пример реализации агентного RAG’а

RAG+Ragas: учим AI-помощника учить без галлюцинаций

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер

Rise of RAG: от плоских векторов к темпоральным графам в юридическом домене

Когда фантастика 1939 года становится реальностью 2025-го

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain

🚀 Идея, Которая Важнее Кода

Краткий обзор 10 локальных UI для LLM