- PVSM.RU - https://www.pvsm.ru -

Стратегического покерного бота Libratus адаптировали для военных симуляторов

Стратегического покерного бота Libratus адаптировали для военных симуляторов - 1В 2017 году покерный бот Libratus попал в заголовки СМИ, когда обыграл четырёх профессионалов [1] в безлимитный холдем на дистанции 120 000 рук. Теперь технологию адаптировали для военного применения [2].

Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.

Libratus («сбалансированный» с латинского языка) создан исследователями из Университета Карнеги-Меллона для тестирования идей автоматизированного принятия решений на основе теории игр. В начале прошлого года, после громкой победы над профессионалами, ведущий автор программы, профессор Туомас Сандхолм, основал стартап под названием Strategy Robot, чтобы адаптировать игровую технологию для использования правительством. Например, в военных играх и симуляциях для изучения военной стратегии и планирования. В конце августа, согласно публичным записям, компания заключила двухлетний контракт с армией США на сумму до $10 млн. Финансирование выделено Отделением оборонных инноваций (Defense Innovation Unit), которое Пентагон образовал в 2015 году для улучшения контактов с компаниями Кремниевой долины и более активного внедрения новых технологий.

Стратегического покерного бота Libratus адаптировали для военных симуляторов - 2
Стратегия Libratus на различных этапах раздачи. По итогам раздачи модель игры против конкретного оппонента уточняется

Libratus построен на алгоритмической (вычислительной) теории игр. В хэдзапах с профессионалами бот выиграл более 1,8 миллиона условных долларов: на протяжении турнира он разработал мощные стратегии ставок и даже продемонстрировал возможность блефа.

Сандхолм уверен, что этот подход применим ко многим другим играм, а также военным симуляторам. Сейчас военные игровые упражнения обычно проверяют только небольшое количество стратегий для воображаемых противников: «Это открывает перед вами много возможностей для эксплуатации, потому что настоящий противник может играть не в соответствии с вашими предположениями», — говорит [2] профессор.

Сандхолм отказывается обсуждать специфику проектов Strategy Robot, хотя фирма заключила ещё как минимум один государственный контракт. Он говорит, что программа помогает в имитационных задачах, которые включают в себя принятие решений в моделируемом физическом пространстве, например, где разместить воинские части.

Покерная техника Libratus позволяет предположить, что стратегический бот может дать военным некоторые удивительные рекомендации. Профессиональные игроки, которые противостояли боту, по ходу турнира с удивлением обнаружили, что он неожиданно переключается с тайтовой на гиперагрессивной тактику, так что его действия практически невозможно предсказать — но все действия бота строго нацелены на победу. «Это странно, потому что нет впечатления, что он играет лучше вас, но затем вы смотрите на счёт и понимаете, что произошло», — говорит Сандхолм.

По мнению специалистов, подобные технологии могут сделать военные игры и симуляции более полезными, хотя результаты всё равно останутся лишь одним из компонентов стратегического планирования. Реальный мир намного сложнее и запутаннее, чем сценарии, которые способны освоить даже лучшие технологии ИИ.

Стратегический бот Libratus — не единственная попытка Пентагона применить современную теорию игр и слабый ИИ в военном деле. Исследовательское агентство DARPA запустило специальную программу «Последовательное взаимодействие в играх с неполной информацией применительно к принятию сложных военных решений (SI3-CMD)» [3]. Майкл Уэллман, профессор Мичиганского университета, говорит, что пример Libratus показывает: технология почти созрела для реального применения: «Прорыв в покере был просто поразительным, и с другими играми дела идут быстро. Пришло время попробовать это в более реальных областях», — сказал он.

Кроме Strategy Robot, профессор Сандхолм основал ещё один стартап Strategic Machine, где адаптирует стратегического бота для коммерческих задач, таких как рынки электроэнергии, спорт и компьютерные игры.

Технологии ИИ интересуют военных не только США, но также России [4] и Китае [5], пишет Wired. Профессор Сандхолм не разделяет опасения по этому поводу. Он считает, что ИИ «сделает мир намного безопаснее».

Автор: alizar

Источник [6]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/iskusstvenny-j-intellekt/306023

Ссылки в тексте:

[1] обыграл четырёх профессионалов: https://habr.com/ru/post/409333/

[2] адаптировали для военного применения: https://www.wired.com/story/poker-playing-robot-goes-to-pentagon/

[3] «Последовательное взаимодействие в играх с неполной информацией применительно к принятию сложных военных решений (SI3-CMD)»: https://www.darpa.mil/program/serial-interactions-in-imperfect-information-games-applied-to-complex-military-decision-making

[4] России: https://tass.ru/obschestvo/4524746

[5] Китае: https://www.wired.com/story/ai-cold-war-china-could-doom-us-all/

[6] Источник: https://habr.com/ru/post/436958/?utm_campaign=436958