В гонке за следующей волной «умных» систем большие языковые модели берут на себя неожиданные роли. Одна из самых интересных — использовать такие модели как «судей» для оценки других моделей. Подход уже экономит командам массу ручной работы, но остаются вопросы: способен ли LLM уловить каждую тонкую ошибку? Что происходит в ситуациях, где критичны человеческая интуиция или глубокая предметная экспертиза?
Рубрика «ai agent» - 2
LLM в роли «судьи» vs. человеческая оценка: почему вместе — лучше
2025-10-14 в 11:00, admin, рубрики: AI, ai agent, genai, human in the loop, llm, llm-модели, rag, ИИ, ии-агенты, оценка моделейЗоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение
2025-10-03 в 12:33, admin, рубрики: ai agent, framework, llm, агентные воркфлоу, агентные системы, агентный ИИ, агенты, ии-агенты, искусственный интеллект, языковые моделиПривет! В этой статье я детально разберу основные фреймворки для AI-агентов, попробую их побенчить и детально распишу их плюсы и минусы. Если вы подступались к агентам, то первым вопросом наверняка стало «а на чем их делать?». Отовсюду все говорят про langchain и десяток других фреймворков, звучат аббревиатуры типа MCP и A2A, какие-то Swarmы и CrewAI, мультиагентность и самое всякое разное.
IT-лидеры видят большой бизнес-потенциал в малых моделях ИИ
2025-10-02 в 11:00, admin, рубрики: AI, ai agent, Fine-tuning, gartner, genai, llm, llm-модели, rag, ИИИТ-лидеры видят большой бизнес-потенциал в малых моделях ИИ благодаря гибкости, низкой стоимости и нацеленности на конкретные задачи малые языковые модели (SLM) лучше подходят для бизнес-специфичных приложений и вскоре могут обойти LLM по использованию в корпоративной среде.
Малые языковые модели (SLM) дают CIO больше возможностей разрабатывать специализированные, отраслевые AI-приложения, эксплуатация которых дешевле, чем систем на базе универсальных больших языковых моделей (LLM).
AI-помощник влияет на счастье пользователей или нет
2025-10-01 в 14:49, admin, рубрики: AI, ai agent, облакаПривет! С вами Никита Кострикин, руководитель направления из Cloud.ru. Мы с командой запустили AI-помощника Клаудия, чтобы упростить работу с нашим облаком. В статье рассказываю, что он умеет делать, как его троллят пользователи, а еще — какие тулы и агенты находятся внутри, какие вызовы мы преодолели в процессе разработки и что планируем улучшить.
Что такое AI-агент и из каких основных частей он состоит
2025-09-28 в 15:31, admin, рубрики: ai agent, из чего состоит ai агент, что такое ai агентВведение
Всем привет! Меня зовут Максимов Максим, я — NLP инженер в компании red_mad_robot. В этой статье хотел бы рассказать об определении AI-агента, а также об основных его компонентах. Также на практических примерах будет показано, как каждый из компонентов может быть реализован.
Содержание:
Как строить умных AI-агентов: уроки Context Engineering от Manus
2025-08-28 в 11:00, admin, рубрики: AI, ai agent, ai assistants, few-shot prompting, large language model, llm, manus, MCP, nlp, rag
В самом начале проекта Manus перед нашей командой встал ключевой вопрос: обучать ли end-to-end агентную модель, используя open-source foundation-модели, или же строить агента поверх возможностей in-context learningЧитать полностью »
Неожиданный результат: ИИ замедляет опытных разработчиков
2025-08-25 в 11:00, admin, рубрики: AI, ai agent, ai tools, benchmark, developer, development, ИИ, ии помощникМы провели рандомизированное контролируемое исследование (RCT), чтобы оценить, как инструменты искусственного интеллекта начала 2025 года влияют на продуктивность опытных open-source разработчиков, работающих в своих собственных репозиториях. Неожиданно оказалось, что при использовании ИИ-инструментов разработчики выполняют задачи на 19% дольше, чем без них — то есть ИИ замедляет их работу.
ИИ под контролем: Guardrails как щит от рисков в агентных системах
2025-08-14 в 11:00, admin, рубрики: AI, ai agent, genai, large language model, llm, ИИ, ии чат-бот, ии-ассистент, искусственный интеллект
Вы когда-нибудь задавали вопрос AI-чатботу и получали в ответ что-то вроде: «Я не могу с этим помочь»Читать полностью »
Стартап за выходные: AI-агент для БД, часть 2
2025-07-27 в 17:57, admin, рубрики: ai agent, mastra-ai, tauri, TypeScript
Ну кто не мечтает запустить стартап за одни выходные?
Давно хотел развеяться, и чутка отвлечься от рутины и работы.
А ещё давно хотел пощупать Tauri v2, и новомодные фреймворки для построения AI-агентов (ai-sdk / mastra / llamaindex).

