Рубрика «embeddings» - 2

RLM-Toolkit: Полное руководство по обработке 10M+ токенов

2026-01-18 в 11:01, admin, рубрики: AI Security, embeddings, InfiniRetri, LangChain, llm, python, rag, RLM, контекст, токены

От теории до production — архитектура, алгоритмы, безопасность

Привет!

Это исчерпывающее руководство по RLM-Toolkit — open-source библиотеке для работы с контекстами произвольной длины.

Что рассмотрю:

Формальная теория RLM (State Machine, рекурсия)
InfiniRetri: математика attention-based retrieval
H-MEM: когнитивная архитектура памяти
RAG vs KAG vs GraphRAG vs InfiniRetri
Security: CIRCLE compliance, sandbox escape prevention
Реальные примеры с логами выполнения
Troubleshooting и best practices

Уровень: от middle до PhD-level исследований.

🚀 Читать полностью »

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

2026-01-13 в 9:01, admin, рубрики: embeddings, machine learning, ml, nlp, ruvds_статьи, вектор, векторное представление, машинное обучение, эмбеддинги

Я уверен, вы видели модели машинного обучения, которые принимают текст и предсказывают, является ли он спамом. Аналогично модель может проанализировать отзыв о фильме и определить его тональность — положительную или отрицательную, понимать что «груша» связана с «яблоком» куда больше, чем с «теплоходом».

Первое правило обучения любой модели машинного обучения — это преобразование входных данных в числа. Любой цифровой объект можно представить как некое число: картинку, текст, аудио или видеофайл — практически всё что угодно.

Читать полностью »

Как затащить AI в Java-Kotlin проект

2026-01-12 в 14:56, admin, рубрики: AI, Docling, embeddings, java, kotlin, llm, state graph, Vector DB, ИИ

Мир Enterprise-разработки на Java/Kotlin и мир нейронных сетей кажутся параллельными вселенными. С одной стороны - статическая типизация, многопоточность, Spring-контейнеры, а с другой - Python-скрипты, тензорные операции и эксперименты в Jupyter Notebook. Между ними - пропасть, через которую многие команды не решаются перешагнуть.

Читать полностью »

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

2026-01-11 в 11:16, admin, рубрики: Claude API, embeddings, fastapi, llm, nlp, postgresql, qdrant, rag, Text-to-SQL, чат-бот

После 10 лет внедрения BI-систем (Qlik Sense, Power BI, Data Lens) я понял одну вещь: дашборд — это не решение. Это данные для решения. А между данными и решением — пропасть, которую преодолевает человек.

В этой статье покажу, как построил RAG-систему с чат-интерфейсом для базы из 600 000 записей техники из Федресурса. Без философии — только архитектура, код и грабли.

Проблема: почему дашборды не работают

Типичный сценарий. Аналитик открывает дашборд с данными о технике в лизинге. Нужно найти топ-10 компаний с бензовозами в Московской области.

Что происходит:

Ищет нужный дашборд (их 15 штук)
Читать полностью »

Обучение эмбеддингов GitHub репозиториев

2026-01-05 в 19:16, admin, рубрики: embeddings, machine learning, wasm

TL;DR

Идея:Читать полностью »

Автоматизация подготовки датасета для задачи сегментации объектов: от сбора данных до готового прототипа за пару дней

2025-12-31 в 9:15, admin, рубрики: activelearning, cvat, deeplearning, embeddings, Milvus, SAM3, yolo

Проблема

Делаем в свободное время робототехнический проект, нужно сделать прототип , который требует обучения модели сегментации на специфичных данных, а также должен мочь масштабироваться. Типы объектов я озвучить не могу, но далее в качестве примера мы будем работать с баночками red bull.

Классический подход для решения задачи под ключ для уникальных типов классов — это дни и даже недели ручной работы для получения качественного результата:

Сбор и запись данных
Удаление дубликатов вручную
Ручная разметка тысяч изображений (Это и деньги, и время)
Читать полностью »

La Perf — бенчмарк локального ИИ, или M-серия наносит ответный удар

2025-11-15 в 19:16, admin, рубрики: AI, CUDA, embeddings, llm, localai, mlx, mps, vlm

Интро

Если вам интересен мир ИИ и вы хотите не просто делать fit, predict на удаленной ВМ, а изучать что-то локально, экспериментировать и упрощать себе жизнь, запуская модели прямо на своем девайсе — скорее всего, вам понадобится достаточно мощное железо.

Эта статья - попытка ответить на вопрос эффективности железа для популярных AI задач: LLM, VLM, эмбэддинги.

Она будет полезна как ML/AI Инженерам, так и просто Энтузиастам, которые выбирают себе железо для локального инференса gpt-oss.

TL;DR:

M4 Max - лучший по эффективности энергопотребления
Читать полностью »

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер

2025-11-15 в 17:02, admin, рубрики: embeddings, llm, llm-агент, neuron, php, rag, rag ai, rag_api, Vectorization

RAG (Retrieval-Augmented Generation или генерация, дополненная поиском) - это метод искусственного интеллекта, сочетающий генеративную большую языковую модель (LLM) с внешней базой знаний для создания более точных, контекстно-зависимых и актуальных ответов. Принцип его работы заключается в том, что сначала извлекается релевантная информация из набора документов или источников данных, а затем эта информация передается в LLM для формирования окончательного ответа. Этот процесс позволяет модели выдавать более точные ответы, менее подверженные “галлюцинациям”, и ее можно обновлять без дорогостоящего переобучения.

Читать полностью »

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

2025-10-31 в 8:12, admin, рубрики: AI, embeddings, large language model, qdrant, rag

Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода (например, SQL или Python) и англоязычной терминологии.

Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки:

Умение распознать тематику близких по значению русских слов (омонимы);
Читать полностью »

Как открытые веса раскрыли секреты обучения GPT-5

2025-10-10 в 8:52, admin, рубрики: adult-content, embeddings, github, glitch-tokens, gpt-5, gpt-oss, membership-inference, OpenAI, tokenizer, training-data

Команда AI for Devs перевела статью, показывающую, что открытые веса — это не только про прозрачность, но и про утечку тайн обучения.На примере модели GPT-oss автор показывает, как можно восстановить части обучающего пайплайна и даже выявить, что GPT-5 видела фразы с сайтов для взрослых.

Недавно OpenAI выпустила модель с открытыми весами. В этой статье разберём, как этот релиз неизбежно раскрывает часть информации об их обучающем пайплайне — и заодно покажем, что GPT-5 действительно обучалась на фразах с сайтов для взрослых.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «embeddings» - 2

RLM-Toolkit: Полное руководство по обработке 10M+ токенов

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

Как затащить AI в Java-Kotlin проект

Как я заменил BI-дашборд на AI-чат: архитектура RAG-системы для 600K записей

Проблема: почему дашборды не работают

Обучение эмбеддингов GitHub репозиториев

TL;DR

Автоматизация подготовки датасета для задачи сегментации объектов: от сбора данных до готового прототипа за пару дней

Проблема

La Perf — бенчмарк локального ИИ, или M-серия наносит ответный удар

Интро

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Как открытые веса раскрыли секреты обучения GPT-5