Рубрика «embeddings» - 3

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

2025-09-15 в 22:30, admin, рубрики: embeddings, nlp, python, что такое эмбеддинги

Всем привет! Меня зовут Максимов Максим, я — NLP‑инженер в компании red_mad_robot. В этой статье я хотел бы рассказать о подходах в работе с векторными представлениями данных, а именно — эмбеддингами.

Сегодня в меню:

Что такое эмбеддинг? Освежим свои знания, и вспомним что это такое формально.
Из чего можно получить эмбеддинги? Рассмотрим популярные форматы данных, которые мы можем представить в векторном виде. Также рассмотрим способы, которыми мы можем преобразовать эти данные в эмбеддинги.
Читать полностью »

Три сказа о построении RAG: От выбора модели до форматирования базы знаний

2025-09-05 в 10:06, admin, рубрики: embeddings, faiss, json, LangChain, llm, nlp, rag, Вкусвилл

Читать полностью »

Отгадай слово дня: от ручного поиска к автоматизации

2025-08-09 в 6:20, admin, рубрики: AI, embeddings, javascript, python, игры

На прошлой неделе наткнулся на забавную игру в слова – contexto.me, смысл прост: нужно отгадать секретное слово. При этом после каждой попытки видно, насколько близко по смыслу ваше слово было к ответу. Поиграв пару дней, захотелось написать такую игру самому, а также автоматизировать процесс решения, про что и данная статья.

Дисклеймер: на хабре есть две публикации про написание подобной игры: одна больше про код, другая Читать полностью »

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

2025-07-25 в 10:57, admin, рубрики: cnn, embeddings, Visual transformer, биометрическая аутентификация, биометрия, искусственный интеллект, Компьютерное зрение, распознавание изображений, эмбеддинги

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально.

Читать полностью »

Как я создал Text Extract API для RAG за 2 дня с помощью AI и Cursor: подробный кейс

2025-07-08 в 8:28, admin, рубрики: AI, api, embeddings, rag, исскуственный интеллект, софтонит, управление it-отделом 8

Разработка с помощью AI‑инструментов меняет подход к созданию ПО. Я сам убедился в этом на практике: всего за два дня мне удалось создать Text Extract API для RAG, используя Claude 4.0, Gemini Pro 2.5 и IDE Cursor. Этот эксперимент показал, что нейросети — уже не просто хайп, а мощный ассистент, способный значительно ускорить процесс разработки.

Читать полностью »

Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector

2025-06-24 в 8:01, admin, рубрики: cloud, DBaaS, embeddings, pgvector, postgresql, selectel, vector, vectordb

Итак, ваш проект вырос и вам потребовалась новая функциональность, будь то рекомендательный движок, база знаний или автоматизированная первая линия техподдержки. Для всего этого можно использовать векторный и/или семантический поиск, а также интегрировать в проект LLM. Поздравляю — теперь вам нужно еще и хранить embedding-векторы, а также искать по ним ближайшие объекты. Решений два: внешняя векторная БД или интеграция всего этого богатства в существующий стек. Второй путь проще на старте, немного быстрее и обычно дешевле — разумеется, если вы уже используете PostgreSQL.

Привет! Меня зовут Александр Гришин, я отвечаю за развитие продуктов хранения данных в Selectel: облачных баз данных и S3-хранилища. В этой статье я расскажу о pgvector — расширении для PostgreSQL, которое позволяет добавить векторный поиск без внешних сервисов, пересборки архитектуры и большого количества работы. Материал пригодится продуктовым командам, архитекторам, бэкенд-разработчикам и инженерам данных.Читать полностью »

Соединяем физику и лирику. Как я собрал рекомендательную систему для стихов с помощью Flask, sqlite-vec и Hugging Face

2025-06-07 в 12:11, admin, рубрики: backend, embeddings, flask, llm, nlp, poetry, python, Texts, Transformers, vectors

Люблю я кодить и стихи —
Вот, в общем, все мои грехи...

А. С. Пушкин

Привет! Я Константин Хабазня, преподаватель программирования и математики, а также автор (что бы это ни значило).

N-нное время назад увлёкся NLP (Natural Language Processing), что вполне логично для писателя, который кодит (или кодера, который пишет).

Почитав интернет и пару вводных книжек, отправился учиться на ДПО в МФТИ. В качестве выпускного проекта придумал себе задачу — создать рекомендательную систему для стихов Читать полностью »

RAG: Дообучение модели эмбеддингов для повышения точности поиска

2025-06-05 в 15:19, admin, рубрики: embeddings, finetuning, hard-negative, lora, rag, tripletloss, искусственный интеллект, машинное обучение

Привет! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы продолжаем серию статей, в которой я рассказываю о том, как мы с командой разрабатывали ИИ-помощника. В прошлой статье мы обсудили, почему стандартные подходы к работе с документами не всегда работают, и какие шаги помогли нам повысить качество поиска без существенных затрат памяти на GPU.

Сегодня речь пойдёт о следующем этапе: дообучении (fine-tuning) модели эмбеддинговЧитать полностью »

Как юрист с помощью вайбкодинга пилит в одного место для юридических экспериментов с ИИ

2025-05-27 в 8:00, admin, рубрики: AI, embeddings, llm, SvelteJs, SvelteKit

Всем привет! Меня зовут Владимир Глебовец, также известный в среде юридического сообщества, как LawCoder. С 2007 года я работаю юристом, а с 2018 в свободное от работы время, программирую инструменты, которые потом использую в юридической работе. Обычно я пишу заметки на VC и в телеграме, а вот писать на Хабр не решался, т. к. ничего полезного для «трушных» программистов я написать не мог, ибо мой уровень соответствует понятию Low Coding, каламбур из которого (Low‑Law) собственно и дал название моему блогу об автоматизации юридических процессов.

Читать полностью »

Как выбрать embedding модель без датасета и исторических данных

2025-02-24 в 9:15, admin, рубрики: AI, embeddings, nlp, python, rag, retrieval, retrieval augmented generation

Введение

С появлением больших языковых моделей тема векторного поиска обрела новое дыхание. Компании, которые хотят внедрить архитектуру Retrieval-Augmented Generation (RAG), сталкиваются с вопросом: как выбрать эмбеддинги, которые будут работать эффективно именно с их данными?

Выбор эмбеддинг-модели — это стратегически важное и долгосрочное решение, так как оно определяет качество поиска и производительность системы. Но этот выбор особенно сложно сделать на ранних этапах развития вашего проекта, когда данных для анализа ещё нет. При этом замена модели в будущем может оказаться дорогостоящей и ресурсозатратной.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «embeddings» - 3

Что такое эмбеддинги и как с ними работать. Вводная для начинающих

Три сказа о построении RAG: От выбора модели до форматирования базы знаний

Отгадай слово дня: от ручного поиска к автоматизации

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Как я создал Text Extract API для RAG за 2 дня с помощью AI и Cursor: подробный кейс

Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector

Соединяем физику и лирику. Как я собрал рекомендательную систему для стихов с помощью Flask, sqlite-vec и Hugging Face

RAG: Дообучение модели эмбеддингов для повышения точности поиска

Как юрист с помощью вайбкодинга пилит в одного место для юридических экспериментов с ИИ

Как выбрать embedding модель без датасета и исторических данных

Введение