Рубрика «векторный поиск»

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

2026-02-09 в 17:31, admin, рубрики: ai-агенты, chromadb, llama, llm, rag, redis, векторный поиск, локальные модели

Три месяца назад я наблюдал, как мой агент на Llama 3.1 8B в третий раз спрашивает, как меня зовут.

Я представился в первом сообщении. Двести сообщений назад...

Агент забыл. Не потому что тупой. Потому что контекст переполнился и начало разговора уехало в никуда.

Это был момент, когда я понял: мы неправильно думаем о памяти.

Почему большие контексты — это ловушка

Когда вышел Claude с контекстом на миллион токенов, казалось — проблема решена. Запихиваем всё в контекст, модель помнит всё. Красота.

Потом пришёл счёт за API.

Читать полностью »

Создаем простую систему RAG на Python

2025-12-25 в 14:09, admin, рубрики: ml, rag, векторный поиск, генеративные модели, семантический поиск, эмбеддинги

Представьте, что вы предоставляете своему ИИ конкретные релевантные документы (или фрагменты), которые он может быстро просмотреть, чтобы найти необходимую информацию, прежде чем ответить на ваши вопросы. То есть, вместо поиска по всей базе данных (которая может не поместиться в контекстное окно модели LLM, или даже если поместится, это потребует много токенов для ответов), мы предоставляем LLM только релевантные документы (фрагменты), которые ему необходимо найти, чтобы ответить на вопрос пользователя.

Читать полностью »

Как я добавил систему рекомендаций контента в легаси-проект на PHP 7.2

2025-10-16 в 12:57, admin, рубрики: Ollama, php, qdrant, библиотека, векторный поиск, рекомендательная система, рекомендательные системы

Привет! Хочу поделиться историей о том, как столкнулся с проблемой, возможно знакомой многим разработчикам: необходимость внедрить систему рекомендаций в проект, который все еще работает на старой версии php 7.2

Обновление версии php в legacy-проекте — это часто настоящий квест. То времени нет, то бизнес-фичи надо пилить, то еще какие-то причины. И часто бывает, что обновление версии php в командах откладывается на потом. Так проекты, даже очень большие живут годами на старых версиях php.

Читать полностью »

С помощью ИИ этот парень запустил конкурента Google прямо у себя в кладовке

2025-09-12 в 17:00, admin, рубрики: Google, searcha page, seek ninja, векторный поиск, ии-поиск, райан пирс

Почти тридцать лет назад, когда Google только выходил на свою победную тропу, у её основателей почти не было железа.

Читать полностью »

Запустили векторный поиск в YDB: рассказываем, как он работает

2025-07-15 в 6:00, admin, рубрики: llm, ydb, базы данных, векторный поиск, высоконагруженные системы, машинное обучение, нейросети, поиск, работа с данными

В новой версии YDB Читать полностью »

Как мы внедрили векторный поиск в Postgres Pro

2025-06-18 в 13:36, admin, рубрики: postgres, Postgres Pro, Администрирование баз данных, вектор, векторизация, векторные базы данных, векторный поиск, разработка баз данных

Представьте, что вы зашли в интернет-магазин купить пару кроссовок. Вы открываете описание модели, которая вам нравится, и сайт тут же предлагает похожие товары — и они действительно похожи. Как это работает?

Ответ прост и сложен одновременно: это векторный поиск — одна из самых перспективных технологий, меняющих подходы к работе с информацией.

Читать полностью »

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

2025-03-22 в 11:54, admin, рубрики: chatgpt, Docling, faiss, gpt, llm, question answering, rag, retrieval augmented generation, векторный поиск, парсинг PDF

Предисловие

В этом посте я расскажу про подход, благодаря которому я занял первое место в обеих призовых номинациях и в общем SotA рейтинге.

Памятка по RAG

RAG - это инструмент, расширяющий возможности LLM через “подключение” к ней базы знаний любого размера.

Путь разработки базовой RAG системы состоит из этапов:

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «векторный поиск»

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

Почему большие контексты — это ловушка

Создаем простую систему RAG на Python

Как я добавил систему рекомендаций контента в легаси-проект на PHP 7.2

С помощью ИИ этот парень запустил конкурента Google прямо у себя в кладовке

Запустили векторный поиск в YDB: рассказываем, как он работает

Как мы внедрили векторный поиск в Postgres Pro

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Предисловие

Памятка по RAG

Путь разработки базовой RAG системы состоит из этапов: