Рубрика «llm» - 10

Agent Harness: одна LLM, разные результаты — в чем секрет?

2026-04-08 в 13:15, admin, рубрики: claude code, codex, cursor, harness, llm, llm-агент, llm-архитектура, nlp, вайбкодинг

Использование кодовых агентов (Codex, Cursor, Claude Code) стало обыденностью. Внутри разных AI-агентов могут использоваться одни и те же модели, но результаты будут сильно отличаться.

Например, есть мнение, что Cursor лучше и быстрее справится с написанием качественного UI, Claude Code покажет себя лучше в проектировании архитектуры приложения, а WindSurf лучше остальных создаст прототип системы.

Почему одна и та же модель в разных агентах дает разный результат? Давайте разбираться.

Читать полностью »

Один скилл, четыре модели — что может пойти не так

2026-04-08 в 10:16, admin, рубрики: AI skills, ai-агенты, claude, deepseek, gemini, gpt, llm, tool calling, кроссмодельное тестирование

На GitHub лежат сотни AI-скиллов. Скилл для code review, скилл для дебага, скилл для обработки PDF, скилл для анализа безопасности. Установил в Cursor или Claude Code — и твой AI-ассистент стал умнее. Звучит как npm install: поставил пакет, он работает.

Но скилл — не пакет. Это текстовый файл с инструкциями, который читает языковая модель. А модели читают по-разному.

Читать полностью »

«Сожжение за ересь» в цифровую эпоху: почему ИИ не новый римский папа, а просто очень большая Википедия

2026-04-08 в 8:47, admin, рубрики: llm, nlp, анализ данных, Библеистика, групповой анализ ИИ, искусственный интеллект, критическое мышление, логика, экзегеза

Дисклеймер для модераторов и читателей. Да, мы продолжаем тему на стыке веры и технологий. Нет, автор не планирует основывать новую техноцерковь или заменять Святого Духа GPU-кластером. Просто далеко не везде об этом можно поговорить, а техничный Хабр позволяет обсуждать столь сложные вещи. Хорошо, что мы живём не в XVI веке (хотя у нас и своих забот хватает), и за оценку новых технологических возможностей максимум грозит, что какая-то добрая душа из местных охранителей заботливо принесёт горящий уголёк в карму минусов. Как видно, и на такое можно реагировать без негатива, а скорее с долей юмора.

Читать полностью »

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

2026-04-08 в 8:27, admin, рубрики: amd, gpu, inference, llm, local ai, metal, qwen, zig

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потребительской видеокарте AMD за $500 — без ROCm, без CUDA, без MLX, одним бинарником на Zig.

Это пост про ZINC — inference engine, который мы строим с нуля под железо, которое люди реально покупают. Не как proof of concept, а как рабочий инструмент с OpenAI-совместимым API, потоковой генерацией и встроенным чатом.

Читать полностью »

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python

2026-04-08 в 5:16, admin, рубрики: llm, nlp, prompt engineering, pyannote, python, speech-to-text, STT, Whisper, диаризация

Каждый день в российском бизнесе происходят миллионы телефонных звонков. Колл-центры, клиники, юридические конторы, отделы продаж — везде, где есть телефон, есть поток неструктурированных данных, который никто не обрабатывает. Менеджер повесил трубку, записал в CRM «клиент интересовался» — и 80% информации из разговора потерялось.

Я потратил полгода на то, чтобы построить пайплайн, который берёт аудиозапись телефонного звонка и выдаёт структурированный JSON: кто звонил, чего хотел, какие суммы называл, что договорились делать дальше. В процессе набил достаточно шишек, чтобы написать эту статью.

Читать полностью »

Заставляем голосовых ассистентов Марусю и Салют материться без принуждения и спецсредств

2026-04-06 в 6:16, admin, рубрики: AI, llm, nlp, prompt injection, TTS, user input, voice assistant, безопасность, голосовые ассистенты, уязвимости

Всем привет! Не такую первую публикацию я планировал сделать на Хабр: есть пара более серьёзных и интересных тем, которыми я планирую поделиться, но перфекционизм пока не даёт их добить.

А тут получилась спонтанная и короткая история из разряда «поигрался - ~~проиграл~~ задумался», которая неожиданно упёрлась в этику и безопасность.

Читать полностью »

Применение ИИ на производстве — 6 реальных примеров

2026-04-04 в 17:15, admin, рубрики: AI, BMW, ERP, llm, Nvidia, rag, tesla, автоматизация бизнес-процессов, внедрение ии, ии-агенты

Привет! Сегодня поговорим о применении ИИ в промышленности, которая на самом деле — одна из лучших сфер для внедрения AI-технологий.

Читать полностью »

Как продакт без тех. бэкграунда запустил два продукта за неделю: стек, флоу и MCP под капотом

2026-04-04 в 11:16, admin, рубрики: llm, MCP, mvp, product management, vibe coding, стартап

Дисклеймер: я продакт, не разработчик. Тех. бэкграунд — теоретический. Эта статья про то, как выглядит вайб-кодинг глазами PM и что реально работает, а не что обещает маркетинг.

Контекст и проблема

У большинства продактов, которые хотят запустить что-то своё, есть один и тот же потолок: нет команды → нет продукта. Найм, онбординг, выстраивание процессов, ожидание первых релизов — это месяцы и деньги ещё до первой проверки гипотезы.

Последнюю неделю я тестировал, насколько этот потолок реален в 2025 году. Результат — два живых проекта:

личный сайт по продуктовому консалтингу
Читать полностью »

Luminarys AI: платформа AI-агентов с изолированными навыками и кластеризацией

2026-04-03 в 20:36, admin, рубрики: AI, IoT, llm, MCP, webassembly, агенты, безопасность, кластеризация

Модульная платформа для запуска AI-агентов, где каждый навык работает в WebAssembly-песочнице, агенты масштабируются на кластер из разнородных машин, а навыки пишутся на Go, Rust или AssemblyScript.

Привет.

Читать полностью »

Локальные 200B уже не выглядят фантастикой: что меняют Bonsai и TurboQuant

2026-04-02 в 22:41, admin, рубрики: Google, llm, llm-архитектура, llm-модели, PrismML, qwen

Последние новости в сфере ИИ натолкнули меня на одну обнадёживающую мысль: локальный запуск очень больших моделей уже не выглядит чем-то совсем фантастическим.

Пока это ещё не новая реальность, но последние опубликованные технологи подводят именно к этому. Давайте разберёмся, какие именно новости к этому подводят и чего можно ожидать в ближайшем будущем.

PrismML анонсировала и выложила в открытый доступ Bonsai 8B

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm» - 10

Agent Harness: одна LLM, разные результаты — в чем секрет?

Один скилл, четыре модели — что может пойти не так

«Сожжение за ересь» в цифровую эпоху: почему ИИ не новый римский папа, а просто очень большая Википедия

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Телефонный звонок → структурированный JSON: строим STT + LLM пайплайн на Python

Заставляем голосовых ассистентов Марусю и Салют материться без принуждения и спецсредств

Применение ИИ на производстве — 6 реальных примеров

Как продакт без тех. бэкграунда запустил два продукта за неделю: стек, флоу и MCP под капотом

Контекст и проблема

Luminarys AI: платформа AI-агентов с изолированными навыками и кластеризацией

Локальные 200B уже не выглядят фантастикой: что меняют Bonsai и TurboQuant

PrismML анонсировала и выложила в открытый доступ Bonsai 8B