Если кто-то считает, что социумом движет здравый смысл, он глубоко ошибается. В 21 веке обществом движет информационное давление, жажда наживы и примитивные эмоции, искусно направляемые теми, кто извлекает из этого выгоду. Я к тому, что ИИ-агенты будут работать даже если это было бы в принципе невозможно.
Вероятность того, что агент средней сложности успешно сам пройдет от постановки цели до результата, примерно такая же, как вероятность увидеть единорога.
В соцсетях все чаще можно увидеть мнение, что ИИ-агенты это миф, о котором мы забудем в следующем году, потому что технология не способна дать требуемый уровень точности и воспроизводимости, особенно на сложных бизнес-процессах.
Думаю, мы еще увидим много пессимизма на этот счет. И это ок. Мой опыт подсказывает, что это довольно поверхностное суждение, эти люди не учитывают разницу между "сырой" технологией и продуктом. А именно в продуктах проявляются все те возможности, о которых говорят лидеры мнений. А продукты еще в разработке. И даже когда на том или ином этапе возникают сложности, они решаются.
=> В ожидании Работокалипсиса можно провести довольно много времени. Кто-то наблюдает, кто-то участвует в процессе, так или иначе, многие сходятся во мнении, что прогноз Deloitte конца 2024 года довольно реален:
Ожидается, что в 2025 году 25% предприятий, использующих GenAI, развернут ИИ-агентов, а к 2027 году этот показатель вырастет до 50%.
Очень удобно смотреть на то, как исполняются прогнозы тех, кто занимается этим профессионально и давно. В отличие от того же прогноза AI-2027, который, кстати говоря, на удивление тоже пока вполне себе реализуется. Взять хотя бы очередное событие на прошлой неделе, анонс AgentGPT от OpenAI. В AI-2027 это звучит так:
В середине 2025 года мир встречает Агента-0 — первое поколение помощников на основе искусственного интеллекта, которые интересны, но несовершенны и требуют постоянного человеческого контроля.
И хотя фраза, которую я где-то услышал, постоянно маячит у меня в голове: "Если кто-то это может сделать, то ИИ все равно это сделает лучше, рано или поздно", человек с ИИ-агентом представляется пока более правдоподобным ближайшим будущим, чем полная автономия.
=> Новые агентные протоколы, создают новые уязвимости для корпоративной безопасности. И это понятно, при такой скорости изменений, традиционно консервативную отрасль сетевой безопасности лихорадит. Отсутствие выделенного уровня управления для агентного трафика влечет за собой ряд существенных рисков.
=> Пока только человек способен осознать, что статистически оптимальная ситуация не означает, что она верна или мудра в текущем контексте. Ах, если бы не последние два слова (в текущем контексте), мы бы так и остались в своих глазах венцом творения. Это мой инсайт из статьи: Почему рассуждения ИИ меня беспокоят больше, чем его ошибки. Хотя она скорее об обратном, об отсутствии практической, прикладной мудрости у ИИ в текущий момент развития технологии.
=> ИИ-агенты, на которых вы все купились это ложь!Ажиотаж вокруг ИИ-агентов, которые якобы смогут полностью заменить программистов и автоматизировать сложные бизнес-процессы, является преувеличением. Для создания надежных и работающих в реальных условиях ИИ-систем по-прежнему необходимы навыки программирования и глубокая техническая экспертиза (никто и не сомневается, именно они и создают продукты). Статья закрыта под пейволл, поэтому публикую краткое резюме здесь:
Медленное внедрение в корпорациях: Вопреки заявлениям в СМИ, крупные компании не спешат массово внедрять ИИ-агентов. Это связано со значительными рисками безопасности, необходимостью изменения устоявшихся рабочих процедур и тем фактом, что многие макроуровневые задачи уже эффективно решаются существующим софтом.
Отсутствие человеческих качеств: ИИ-агенты способны обрабатывать информацию, но им не хватает человеческой интуиции, субъективного понимания и способности действовать по наитию или совершать случайные открытия, которые критически важны для инноваций в бизнесе. Со временем они могут стать излишне педантичными и негибкими в выполнении задач.
Ценность в решении проблем, а не в инструментах: Настоящая ценность заключается не в самом ИИ-инструменте, который становится все более доступным, а в стратегическом применении технологии для решения конкретных бизнес-задач и обеспечения возврата инвестиций (ROI). Компании платят за решение своих проблем, а не за модные технологии.
"Проблема гуру": Основную прибыль от тренда на ИИ-агентов получают те, кто продает идею заработка на них (например, через курсы или сомнительные платформы), а не те, кто успешно внедряет эти решения в B2B-секторе. Часто для этого используются тактики искусственного дефицита и страха упустить выгоду.
От тактики к стратегии: Простое умение пользоваться ИИ-инструментом больше не является уникальным преимуществом. Успех зависит от стратегического внедрения технологии в конкретной бизнес-нише, что требует скорее деловой хватки и консалтинговых навыков, чем просто технических знаний (и не поспоришь).
=> Хочется создавать такие системы, которые могут понимать людей, а не просто обрабатывать их язык. Основная идея заключается в том, что современные большие языковые модели, несмотря на их способность имитировать свободное общение, не обладают реальным пониманием человеческой психологии, эмоций и .
Современные ИИ-агенты, построенные на базе LLM, создают «иллюзию понимания». Они превосходно справляются с семантикой, синтаксисом и распознаванием образов, но им не хватает психологического контекста, чтобы понять, как люди думают, чувствуют и принимают решения.
Это разница между ИИ, который звучит как человек, и ИИ, который понимает человека. Отсутствие такого понимания становится критическим риском, особенно в важных бизнес-процессах и при принятии ответственных решений.
Компания Receptiviti разработала технологию, которая добавляет ИИ-агентам слой психологического понимания. Эта система анализирует язык в реальном времени для выявления таких аспектов, как:
Ключевой особенностью является анализ так называемых «стоп-слов» (предлогов, местоимений, союзов), которые традиционные системы NLP и LLM часто игнорируют. Именно эти слова содержат большую часть сигналов о психологическом состоянии человека. AI Meets Psychology: How to Build Agents that Understand People
И теперь небольшой блиц пользы по MCP-протоколу:
=> Как разработчики могут использовать агентный режим GitHub Copilot в связке с MCP-протоколом для решения реальных, сложных инженерных задач, выходящих за рамки простого написания кода в Real world MCPs in GitHub Copilot Agent Mode
=> Создатель популярной Python-библиотеки Pydantic, утверждает, что MCP-протокол может быть универсальным и более чем достаточным решением для организации взаимодействия между ИИ-агентами, и нет необходимости изобретать новые, более сложные протоколы. MCP is all you need. Samuel Colvin, Pydantic
И хотя я с ним не совсем согласен, у MCP есть ряд ограничений, и архитектурных и функциональных, выступление отличное, посмотрите.
Если совсем коротко, то с помощью централизованного маркетплейса MCP-сервисов, где для доступа ко множеству сервисов требуется всего один аккаунт и один API-ключ. Но в видео много и других ценных мыслей.
Основной его тезис заключается в том, что большинство существующих реализаций используют MCP лишь как очередную обертку для API, в то время как полная спецификация протокола позволяет создавать по-настоящему эффективную, контекстно зависимую, коммуникацию между ИИ-агентами. В видео он довольно подробно рассказывает обо всех этих возможностях.
=> Своими глазами видел, как в одном довольно большом паблике автор просил сбросить ему хоть один пример ИИ-агента, который реально работает. Судя по всему, он этим хотел сказать, что ни у кого пока ничего не работает. Вот к примеру супер-агент Genspark и пул его микро-агентов. А где-то через полгода много чего увидим уже, только из моей ideaLAB 4-5 проектов, надеюсь, в рынке уже будет.
=> Пока лучшие открытые фреймворки для создания мультиагентных систем это AutoGen и LangGraph, а вот такие штуки как Restuck позволяют строить более надежные системы. Этот бэкенд фреймворк берет на себя все инфраструктурные задачи мультиагентной системы: обеспечивает бесперебойную работу, управляет состоянием, обрабатывает ошибки и запускает по расписанию.