Рубрика «embeddings» - 3
Три сказа о построении RAG: От выбора модели до форматирования базы знаний
2025-09-05 в 10:06, admin, рубрики: embeddings, faiss, json, LangChain, llm, nlp, rag, ВкусвиллОтгадай слово дня: от ручного поиска к автоматизации
2025-08-09 в 6:20, admin, рубрики: AI, embeddings, javascript, python, игрыНа прошлой неделе наткнулся на забавную игру в слова – contexto.me, смысл прост: нужно отгадать секретное слово. При этом после каждой попытки видно, насколько близко по смыслу ваше слово было к ответу. Поиграв пару дней, захотелось написать такую игру самому, а также автоматизировать процесс решения, про что и данная статья.
Дисклеймер: на хабре есть две публикации про написание подобной игры: одна больше про код, другаяЧитать полностью »
Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности
2025-07-25 в 10:57, admin, рубрики: cnn, embeddings, Visual transformer, биометрическая аутентификация, биометрия, искусственный интеллект, Компьютерное зрение, распознавание изображений, эмбеддинги
Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально.
Как я создал Text Extract API для RAG за 2 дня с помощью AI и Cursor: подробный кейс
2025-07-08 в 8:28, admin, рубрики: AI, api, embeddings, rag, исскуственный интеллект, софтонит, управление it-отделом 8Разработка с помощью AI‑инструментов меняет подход к созданию ПО. Я сам убедился в этом на практике: всего за два дня мне удалось создать Text Extract API для RAG, используя Claude 4.0, Gemini Pro 2.5 и IDE Cursor. Этот эксперимент показал, что нейросети — уже не просто хайп, а мощный ассистент, способный значительно ускорить процесс разработки.
Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector
2025-06-24 в 8:01, admin, рубрики: cloud, DBaaS, embeddings, pgvector, postgresql, selectel, vector, vectordb
Итак, ваш проект вырос и вам потребовалась новая функциональность, будь то рекомендательный движок, база знаний или автоматизированная первая линия техподдержки. Для всего этого можно использовать векторный и/или семантический поиск, а также интегрировать в проект LLM. Поздравляю — теперь вам нужно еще и хранить embedding-векторы, а также искать по ним ближайшие объекты. Решений два: внешняя векторная БД или интеграция всего этого богатства в существующий стек. Второй путь проще на старте, немного быстрее и обычно дешевле — разумеется, если вы уже используете PostgreSQL.
Привет! Меня зовут Александр Гришин, я отвечаю за развитие продуктов хранения данных в Selectel: облачных баз данных и S3-хранилища. В этой статье я расскажу о pgvector — расширении для PostgreSQL, которое позволяет добавить векторный поиск без внешних сервисов, пересборки архитектуры и большого количества работы. Материал пригодится продуктовым командам, архитекторам, бэкенд-разработчикам и инженерам данных.Читать полностью »
Соединяем физику и лирику. Как я собрал рекомендательную систему для стихов с помощью Flask, sqlite-vec и Hugging Face
2025-06-07 в 12:11, admin, рубрики: backend, embeddings, flask, llm, nlp, poetry, python, Texts, Transformers, vectorsЛюблю я кодить и стихи —
Вот, в общем, все мои грехи...А. С. Пушкин
Привет! Я Константин Хабазня, преподаватель программирования и математики, а также автор (что бы это ни значило).
N-нное время назад увлёкся NLP (Natural Language Processing), что вполне логично для писателя, который кодит (или кодера, который пишет).
Почитав интернет и пару вводных книжек, отправился учиться на ДПО в МФТИ. В качестве выпускного проекта придумал себе задачу — создать рекомендательную систему для стиховЧитать полностью »
RAG: Дообучение модели эмбеддингов для повышения точности поиска
2025-06-05 в 15:19, admin, рубрики: embeddings, finetuning, hard-negative, lora, rag, tripletloss, искусственный интеллект, машинное обучениеПривет! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы продолжаем серию статей, в которой я рассказываю о том, как мы с командой разрабатывали ИИ-помощника. В прошлой статье мы обсудили, почему стандартные подходы к работе с документами не всегда работают, и какие шаги помогли нам повысить качество поиска без существенных затрат памяти на GPU.
Сегодня речь пойдёт о следующем этапе: дообучении (fine-tuning) модели эмбеддинговЧитать полностью »
Как юрист с помощью вайбкодинга пилит в одного место для юридических экспериментов с ИИ
2025-05-27 в 8:00, admin, рубрики: AI, embeddings, llm, SvelteJs, SvelteKitВсем привет! Меня зовут Владимир Глебовец, также известный в среде юридического сообщества, как LawCoder. С 2007 года я работаю юристом, а с 2018 в свободное от работы время, программирую инструменты, которые потом использую в юридической работе. Обычно я пишу заметки на VC и в телеграме, а вот писать на Хабр не решался, т. к. ничего полезного для «трушных» программистов я написать не мог, ибо мой уровень соответствует понятию Low Coding, каламбур из которого (Low‑Law) собственно и дал название моему блогу об автоматизации юридических процессов.
Как выбрать embedding модель без датасета и исторических данных
2025-02-24 в 9:15, admin, рубрики: AI, embeddings, nlp, python, rag, retrieval, retrieval augmented generationВведение
С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными?
Выбор эмбеддинг-модели — это стратегически важное и долгосрочное решение, так как оно определяет качество поиска и производительность системы. Но этот выбор особенно сложно сделать на ранних этапах развития вашего проекта, когда данных для анализа ещё нет. При этом замена модели в будущем может оказаться дорогостоящей и ресурсозатратной.
pg_auto_embeddings — считаем эмбеддинги для текста прямо в Postgres, без экстеншенов
2025-01-10 в 11:30, admin, рубрики: embeddings, postgres, postgresql, rag, векторные представления, ИИ, эмбеддингиУ вас есть PostgreSQL база, где хранится множество текстовых данных. Вы хотите использовать векторные представления (embeddings), к примеру, от OpenAI, чтобы построить систему рекомендаций, улучшенный поиск или реализовать RAG для работы с LLM. Но при этом ставить расширения (extensions) не хочется, а может, и вовсе нельзя — например, в облачных Managed PostgreSQL зачастую нет нужных прав.

