Рубрика «llm-архитектура»

За пределами LLM: детерминированный движок рассуждения на конечном алфавите

2026-01-25 в 9:15, admin, рубрики: AI, llm, llm-архитектура, llm-модели, Алгоритмы, искусственный интеллект, искусственный разум, машинное творчество

Часть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)

Когда речь заходит о больших языковых моделях, все сразу отмечают их талант к сочинению и пересказу текстов. Но вот встроить такую модель в реальный продукт — задача куда более каверзная, чем кажется на первый взгляд. На практике вылезают три системных «подводных камня», из‑за которых работать с ними бывает откровенно неудобно.

Читать полностью »

Как я делал свою языковую модель: история эксперимента

2026-01-15 в 11:04, admin, рубрики: AI, llm, llm-архитектура, llm-модели, искусственный интеллект, языковые модели

Уже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать мышление модели от токенов, перенеся его в латентное пространство. Примерно полгода назад я начал первые практические эксперименты и сейчас получил первые практические результаты. Поскольку уровень подготовки читателей очень сильно различается, в статье не будет глубоких технических разборов, а скорее история эксперимента.

Читать полностью »

Искусственный интеллект без иллюзий: как не сжечь бюджет компании на хайпе

2025-11-22 в 9:13, admin, рубрики: llm-архитектура, llm-модели, искусственный интеллект, трансформация бизнеса

Читать полностью »

Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела

2025-10-08 в 19:03, admin, рубрики: AI, ai-агенты, ai-ассистент, AI-инструменты, AI-разработка, llm, llm-агент, llm-архитектура, llm-модели

(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")

Помните свой первый "вау-эффект" от LLM?

Читать полностью »

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

2025-10-01 в 9:00, admin, рубрики: AI, data, llm, llm-агент, llm-архитектура, llm-модели, ml, искусственный интеллект, разработка

Что будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».

Читать полностью »

Разбираемся с суффиксами квантования LLM: что на самом деле значат Q4_K_M, Q6_K и Q8_0

2025-06-16 в 17:15, admin, рубрики: AI, llm, llm-архитектура, llm-модели, llm-приложения, ml, ИИ, ИИ и машинное обучение, искусственный интеллект, квантование

Привет!
Читать полностью »

Как все рынки мира оказались уязвимы конкуренции с любым умным айтишником

2025-05-26 в 4:05, admin, рубрики: llm, llm-архитектура, llm-приложения, MCP, mcp-server, ии-агенты, Мультиагентная система, мультиагентные системы, продукт, фриланс

история о том, как в текущем моменте истории, по сути любой разработчик может в одиночку задизраптить любой вертикальный рынок и даже отрасль

Новая революция и ее предпосылки

Помимо самого ИИ, который как снег на голову, мы находимся на пороге беспрецедентного передела рынков в бизнесе.

Традиционная корреляция между успехом стартапа и созданием рабочих мест ослабевает с каждым днем. AI-native компании будут достигать соответствия продукта рынку (Product Market Fit) быстро с одним основателем, но с более высоким уровнем автоматизации, чем когда-либо прежде. Ок, это про стартапы.

Читать полностью »

Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

2025-05-16 в 20:29, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, rag pipeline, retrieval, retrieval augmented generation, языковые модели

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных.

Читать полностью »

Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации

2025-04-21 в 20:23, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, terminology, языковые модели

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.

Читать полностью »

Сравнение low-code редакторов для разработки приложений на основе LLM

2025-04-06 в 14:19, admin, рубрики: Dify, flowise, langflow, llm, llm-архитектура, llm-модели, llm-приложения, low-code, n8n, ии-агенты

Привет, Habr! Наша команда LLM-разработки подготовила статью с анализом low-code редакторов для разработки пайплайнов на базе LLM-моделей. Тема сравнения пайплайнов назревала давно, так как мы активно используем данные редакторы в своей работе и зачастую сталкиваемся с различными ограничениями решений. Данная статья будет полезна командам, которые только выбирают среду разработки пайплайнов для своих LLM-приложений и ИИ-агентов, а также тем, кто ищет лучший редактор для решения своих задач.

Введение

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm-архитектура»

За пределами LLM: детерминированный движок рассуждения на конечном алфавите

Часть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)

Как я делал свою языковую модель: история эксперимента

Искусственный интеллект без иллюзий: как не сжечь бюджет компании на хайпе

Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела

(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")

Помните свой первый "вау-эффект" от LLM?

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

Разбираемся с суффиксами квантования LLM: что на самом деле значат Q4_K_M, Q6_K и Q8_0

Как все рынки мира оказались уязвимы конкуренции с любым умным айтишником

Новая революция и ее предпосылки

Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных

Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации

Сравнение low-code редакторов для разработки приложений на основе LLM