Доступ к западным большим языковым моделям (далее - БЯМ) закрывается снаружи и, судя по всему, скоро начнёт закрываться изнутри.
Что останется бизнесу и какую цену нам придётся за это платить?
Рубрика «llm-архитектура»
Российский ИИ в прокрустовом ложе между суверенитетом и реальностью
2026-04-12 в 10:41, admin, рубрики: GigaChat, llm-агент, llm-архитектура, llm-модели, qwen, targetaiAgent Harness: одна LLM, разные результаты — в чем секрет?
2026-04-08 в 13:15, admin, рубрики: claude code, codex, cursor, harness, llm, llm-агент, llm-архитектура, nlp, вайбкодингИспользование кодовых агентов (Codex, Cursor, Claude Code) стало обыденностью. Внутри разных AI-агентов могут использоваться одни и те же модели, но результаты будут сильно отличаться.
Например, есть мнение, что Cursor лучше и быстрее справится с написанием качественного UI, Claude Code покажет себя лучше в проектировании архитектуры приложения, а WindSurf лучше остальных создаст прототип системы.
Почему одна и та же модель в разных агентах дает разный результат? Давайте разбираться.
Локальные 200B уже не выглядят фантастикой: что меняют Bonsai и TurboQuant
2026-04-02 в 22:41, admin, рубрики: Google, llm, llm-архитектура, llm-модели, PrismML, qwenПоследние новости в сфере ИИ натолкнули меня на одну обнадёживающую мысль: локальный запуск очень больших моделей уже не выглядит чем-то совсем фантастическим.
Пока это ещё не новая реальность, но последние опубликованные технологи подводят именно к этому. Давайте разберёмся, какие именно новости к этому подводят и чего можно ожидать в ближайшем будущем.
PrismML анонсировала и выложила в открытый доступ Bonsai 8B
Я ненавижу мозговые штурмы. Поэтому я обучил нейросеть делать их за меня
2026-02-14 в 7:16, admin, рубрики: llm-архитектура, llm-модели, llm-приложения, ии-агенты, ии-ассистентВведение: фейл с машинкой по генерации идей
Возможно многие увидят схожую проблему при использовании нейронок. Я уже достаточно долго и часто использую llm для личных и рабочих задач, автоматизирую свои воркфлоу и в моих кейсах модели эффективно справлялись со своими задачами пока не столкнулся с одним кейсом.
За пределами LLM: детерминированный движок рассуждения на конечном алфавите
2026-01-25 в 9:15, admin, рубрики: AI, llm, llm-архитектура, llm-модели, Алгоритмы, искусственный интеллект, искусственный разум, машинное творчествоЧасть 1. Детерминированный движок рассуждения на конечной таблице операции (в перспективе — замена LLM)
Когда речь заходит о больших языковых моделях, все сразу отмечают их талант к сочинению и пересказу текстов. Но вот встроить такую модель в реальный продукт — задача куда более каверзная, чем кажется на первый взгляд. На практике вылезают три системных «подводных камня», из‑за которых работать с ними бывает откровенно неудобно.
Как я делал свою языковую модель: история эксперимента
2026-01-15 в 11:04, admin, рубрики: AI, llm, llm-архитектура, llm-модели, искусственный интеллект, языковые моделиУже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать мышление модели от токенов, перенеся его в латентное пространство. Примерно полгода назад я начал первые практические эксперименты и сейчас получил первые практические результаты. Поскольку уровень подготовки читателей очень сильно различается, в статье не будет глубоких технических разборов, а скорее история эксперимента.
Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела
2025-10-08 в 19:03, admin, рубрики: AI, ai-агенты, ai-ассистент, AI-инструменты, AI-разработка, llm, llm-агент, llm-архитектура, llm-модели
(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")
Помните свой первый "вау-эффект" от LLM?
Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1
2025-10-01 в 9:00, admin, рубрики: AI, data, llm, llm-агент, llm-архитектура, llm-модели, ml, искусственный интеллект, разработкаЧто будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».
Разбираемся с суффиксами квантования LLM: что на самом деле значат Q4_K_M, Q6_K и Q8_0
2025-06-16 в 17:15, admin, рубрики: AI, llm, llm-архитектура, llm-модели, llm-приложения, ml, ИИ, ИИ и машинное обучение, искусственный интеллект, квантование
Привет!
Читать полностью »

