
Корпоративные данные сейчас могут расползаться по разным письмам, отчетам, базам и репозиториям кода. Ответы на сложные вопросы часто требуют не одного, а множества фактов, а также умения синтезировать данные из сотен источников с проверяемыми ссылками и понятной логикой вывода. Обычные агенты и классические RAG-системы часто не подходят для этих задач: они предоставляют поверхностные ответы, плохо управляются в процессе и не объясняют, на каких источниках основан их вывод. Команда Salesforce AI Research предлагает Enterprise Deep Research (EDR), мультиагентную систему, которая делает глубокое исследование управляемым и прозрачным для реальных процессов в компании.
Главная идея: курс можно менять на ходу
Ключевая особенность EDR - управляемый контекст. Пользователь видит план исследования в виде todo.md и может в любой момент скорректировать курс: добавить задачу, поменять приоритеты, уточнить фокус запроса (например, рассматривать только выбранные источники или сделать упор на свежих публикациях). Система сохраняет промежуточные состояния, явно привязывает выводы к источникам и выдерживает длинные сессии. Она не является черным ящиком.
Кто за что отвечает внутри
-
Master Research Agent: основной оркестратор, который декомпозирует запрос на подзадачи, подбирает инструменты, сверяет выводы разных агентов, устраняет противоречия и следит за качеством финального ответа.
-
Специализированные агенты поиска: четыре быстродействующих агента общего, академического, GitHub и LinkedIn поиска, оптимизированных под свой домен с дедупликацией и правильным ранжированием источников.
-
Доменные инструменты через MCP: подключение файлов и внутренних систем компании с помощью специализированных инструментов, таких как анализ документов в Confluence или Notion, а также других MCP-инструментов.
-
Visualization Agent: он способен строить графики и вставлять визуализации в отчет.
-
Механизм рефлексии: эмулирует рефлексию, выявляет пробелы в знаниях, требует уточнения плана и повышения внимания к определенным аспектам запроса.
Как это работает
-
Процесс начинается с запроса пользователя. При необходимости он может загрузить дополнительные материалы. Система формирует видимый план из трех-пяти задач с приоритетами и указанием, откуда взялась задача (исходный запрос, пробел знания или указание пользователя). Доступны разные режимы глубины: быстрый, стандартный и глубокий.
-
Оркестратор генерирует новые подзадачи и поисковые запросы, выбирает, какой специализированный агент или доменный инструмент использовать, дедуплицирует и применяет ограничения (например, только конкретные домены) и собирает результаты с ограничением на число вызовов каждого инструмента.
-
Агенты поиска собирают ответы из различных источников. Система удаляет дубли, нормализует ссылки и сжимает несколько результатов одного запроса. Затем LLM EDR берет краткое изложение каждой задачи из предыдущего раунда, абстракт загруженных файлов, сводку из предыдущего раунда и выдает новый ответ. Важно, что он сжимает результат, сохраняя ссылки на источники, так как за многие итерации могут исчерпаться лимиты на длину контекста.
-
Пользователь может аккуратно направлять процесс, не ставя систему на паузу. Все его сообщения ставятся в очередь и применяются во время следующей рефлексии, чтобы обеспечить атомарность изменений и избежать гонок.
-
В конце каждого итерационного цикла система сверяет все задачи и источники, чтобы выявить пробелы в знаниях, отменить или переоткрыть задачи, которые закрывают нужные вопросы, добавить новые и отследить, что уже закрыто. Затем все повторяется снова, пока не будет достигнуто достаточное покрытие задачи, после чего EDR формирует отчет с воспроизводимым путем и ссылками на источники.
Чем этот агент отличается от обычных
-
Он использует видимый для пользователя и всех агентов план исследования, связанный с планируемыми задачами и источниками каждого действия.
-
Прозрачен для пользователя.
-
Управляем не только до запуска, но и по ходу действия.
-
Имеет встроенный механизм проверки согласованности и качества ответа.
-
MCP позволяет легко и дешево подключать внутренние базы и другие сервисы
-
Контекст сжимается без потери ссылок и других метаданных для долгих сессий
-
Встроен автоматический факт-чекинг и оценка уверенности вывода
Что показали эксперименты
Авторы заявляют, что EDR превосходит лучшие открытые агенты по глубокому поиску на бенчмарках DeepResearch Bench и DeepConsult даже без пользовательского вмешательства. Также они проверили работу EDR на внутренних данных Salesforce. Важно, что исследователи выпустили датасет EDR-200 с полными сценариями для оценки и дообучения, так как многие агенты для глубоких исследований закрыты.
Инженерная часть
Система реализована на FastAPI c поддержкой стриминга, очередей фоновых задач и подробных ошибок. Имеется пользовательский интерфейс на React с использованием Material-UI и React Query, а также поддержка различных провайдеров LLM с авторизацией. Из коробки доступны загрузка файлов, их анализ и подключение различных баз.
Что это значит для нас
EDR полезен тем, что делает агентные системы более надежными и управляемыми, что важно для бизнеса. Пользователь видит, каким путем система пришла к тому или иному ответу. Если результат ему не нравится, он может изменить направление поиска и получить воспроизводимый отчет с источниками, визуализациями и историей принятых решений. Мультиагентный подход и MCP позволяют решать задачи от рыночных обзоров до аудита кода и аналитики по внутренним базам. Открытый код и датасет позволяют верифицировать выводы, а также развивать систему, не полагаясь на авторов.
Таким образом, ИИ не заменяет аналитика, а становится его партнёром. Теперь бизнес может не просто получать ответы, а понимать, почему именно эти ответы верны — и на этой основе принимать действительно обоснованные решения.
***
Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.
Автор: andre_dataist
