Рубрика «llm» - 20
Ретроспектива 2025: год LLM — практика, иллюзия и реальные сдвиги
2026-01-18 в 13:00, admin, рубрики: llm, MCP, prompt, slop, сезон ии в разработкеКоманда AI for Devs подготовила перевод большой обзорной статьи о 2025 годе в мире LLM. Автор подводит итоги года: от vibe coding и coding-агентов до MCP, prompt injection, локальных моделей, браузеров с ИИ и «slop» как культурного феномена.
Это третья часть моей ежегодной серии обзоров всего, что произошло в сфере LLM за последние 12 месяцев. Предыдущие выпуски см. в материалах Stuff we figured out about AI in 2023 и Things we learned about LLMs in 2024.
Этот год оказался насыщенным и принес с собой множество самых разных тенденций.
Я реализовал паттерн памяти из OpenAI Cookbook в Python библиотеку
2026-01-18 в 11:09, admin, рубрики: AI, llm, OpenAI, pythonЯ создал agent-memory-state — open-source Python библиотеку для управления персистентной памятью AI агентов. Реализует паттерн state-based memory из OpenAI Cookbook: профиль пользователя, разделение session/global памяти, LLM-консолидация и защитные механизмы.
Проблема: Агенты без памяти — безликие
Каждый раз, начиная новый разговор с AI-ассистентом, он забывает всё. Ваши диетические предпочтения, привычки в путешествиях, рабочий контекст — стёрты. Приходится объяснять одно и то же снова и снова.
Технологическая сингулярность. От 2 месяцев до 2 дней — Claude и n8n сократили разработку в промышленной IoT
2026-01-17 в 17:17, admin, рубрики: AI, claude, IoT, llm, MCP, n8n, автоматизация, валидация, мнемосхема, промышленная автоматизацияПисать надо только тогда, когда не можешь не писать (С) Л.Н. Толстой
На самом деле я работал над статьей о Claude Code, но тут пальцы сами открыли ноут на начали набивать буквы. Извините!
Приквел
Начну издалека, с темы, максимально далекой от предмета статьи. У меня есть друг, который постоянно норовит втянуть меня в свои хобби. За десятилетие я попробовал стать фанатом ножей, огнестрельного и пневматического оружия, охоты, выживания в БП, полетах на самолетах. Ни одно хобби не зашло.
Log Analyzer Pro 2.0: Добавляем AI-поиск на естественном языке
2026-01-16 в 12:47, admin, рубрики: AI, DevTools, llm, llm-агент, Rust, vscodeВ предыдущей статье я рассказывал, как сделал производительный просмотрщик логов для VS Code с Rust и mmap. Расширение открывает файлы по 10 ГБ без лагов.
Но оставалась проблема: чтобы найти нужное, приходилось писать regex. А regex — это боль. Особенно когда искать нужно "все ошибки подключения к БД" или "таймауты в сервисе auth".
Решение: пусть AI пишет regex за меня.
Что получилось
Нажимаешь "AI", пишешь на человеческом языке — получаешь фильтр:
|
Запрос |
Результат |
|---|---|
|
"все ошибки" |
|
| Читать полностью » |
Всем привет! Сегодня разберём, как проектировать агента, который доезжает до продакшена и приносит пользу бизнесу: от вопросов на старте до стека и практик, без которых он развалится в эксплуатации.
Меня зовут Владимир, на данный момент работаю ML-инженером и разрабатываю мультиагентные системы. К сожалению, пока не могу похвастаться тем, что сократил 20 процентов сотрудников, но достижения имеются...
Как я делал свою языковую модель: история эксперимента
2026-01-15 в 11:04, admin, рубрики: AI, llm, llm-архитектура, llm-модели, искусственный интеллект, языковые моделиУже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать мышление модели от токенов, перенеся его в латентное пространство. Примерно полгода назад я начал первые практические эксперименты и сейчас получил первые практические результаты. Поскольку уровень подготовки читателей очень сильно различается, в статье не будет глубоких технических разборов, а скорее история эксперимента.
LLM нельзя внедрить сверху. Снизу тоже. А как можно?
2026-01-15 в 5:33, admin, рубрики: chatgpt, claude, llm, автоматизация, внедрение ai, конфликт интересов, продуктивность, рынок труда, трудовые отношения, эффективность«Когда один программист заменяет пятерых, четверо начинают искать работу, а пятый — хорошего юриста»
Каждая вторая статья на Хабре сейчас — про LLM. Одни кричат о революции, другие — о пузыре. Тем временем в реальности происходит кое-что интересное.
Цифры впечатляют. Инвестиции в дата-центры в 2025 году превысили $60 миллиардов. Nvidia отчитывается о квартальной выручке в $57 миллиардов — больше годовой прибыли большинства компаний из Fortune 500. Big Tech планирует потратить около $330 миллиардов на инфраструктуру только в этом году. Прогнозы обещают $3-4 триллиона совокупных инвестиций в AI к 2030 году.
Тестирование LLM-приложений с DeepEval
2026-01-13 в 18:26, admin, рубрики: DeepEval, llm, LLM тестирование, llm-приложения, исскуственный интеллектВсем привет! Меня зовут Максим. Я NLP‑инженер в red_mad_robot и автор Telegram‑канала Максим Максимов // IT, AI. В этой статье я расскажу о том, как тестировать приложения с использованием Large Language Model (LLM), на примере инструмента DeepEval.
Тестирование приложений, в которых используются LLM, отличается от тестирования других приложений. В частности, можно выделить 2 основные проблемы:
-
Недетерминированность. В связи со своей спецификой LLM могут давать разные ответы на одни и те же запросы, что создаёт сложности во время тестирования;
-
Работа с естественным языком.Читать полностью »

