Рубрика «покер»

На протяжении десятилетий покер был сложной и важной проблемой в области искусственного интеллекта. Игра включает в себя скрытую информацию — вы не знаете карты ваших оппонентов — поэтому успех требует применения нескольких стратегий. Каждый игрок корректирует поведение исходя из своего представления о том, что ожидает противник, и исходя из накопленной статистики (если речь об онлайн-покере со вспомогательным статистическим ПО). Ценность действия в игре с неполной информацией зависит от вероятности, с которой оно выбрано, и от вероятности, с которой выбраны другие действия.

Такие нюансы сделали покер устойчивым к методам обучения ИИ, которые добились успеха в других играх. Казалось, компьютеры никогда не смогут успешно играть в покер против людей. Но теперь ясно, что все ошибались.

В последние годы новые методы смогли победить лучших людей в хэдзапе (бот Libratus). А сейчас достигнута ключевая веха: бот Pluribus, разработанный в университете Карнеги — Меллона и Facebook, победил элитных игроков за столом с шестью игроками (научная статья опубликована в Science). Что характерно, самообучение программы проводилось на одном 64-ядерном сервере с 512 ГБ памяти. Это не какие-то корпоративные проекты, где нейросеть обучается на десятках тысяч процессорных ядер. Обучение программы вроде Pluribus может повторить практически любой исследователь.
Читать полностью »

Стратегического покерного бота Libratus адаптировали для военных симуляторов - 1В 2017 году покерный бот Libratus попал в заголовки СМИ, когда обыграл четырёх профессионалов в безлимитный холдем на дистанции 120 000 рук. Теперь технологию адаптировали для военного применения.

Разработчики систем слабого ИИ часто сравнивают эффективность своих программ в игровом противостоянии против человека. В играх с полной информацией в любой момент игры все игроки имеют полную информацию о состоянии игры, то есть о позиции и всех возможных ходах любого из игроков. В отличие от таких детерминированных ситуаций, в играх с неполной информацией часть информации о состоянии игры скрыта от игрока — например, карты оппонента. Безлимитный холдем как раз одна из таких игр. Кроме закрытых карт оппонента, добавляется здесь элемент неопределённости за счёт произвольного размера каждой ставки. С учётом этого количество возможных исходов оценивается в 10161. Выработка оптимальной стратегии в условиях неопределённости с учётом тактики оппонента — именно то, что нужно военным.
Читать полностью »

image

О том как совершенствуется искусственный интеллект, можно судить по обычным играм. За последние два десятилетия алгоритмы превзошли лучших мировых игроков: сначала пали нарды и шашки, затем шахматы, «Своя Игра» (Jeopardy!), в 2015 году — видеоигры Atari и в прошлом году — Го.

Все эти успехи — про игры с информационной симметрией, где игроки имеют идентичную информацию о текущем состоянии игры. Это свойство полноты информации лежит в основе алгоритмов, обеспечивающих эти успехи, например, локальном поиске во время игры.

Но как обстоит дело с играми с неполной информацией?

Самым наглядный пример такой игры — покер. Чтобы на деле разобраться с этой игрой и алгоритмами решения этой задачи, мы организуем хакатон по написанию игровых ботов на основе машинного обучения. О том как научить алгоритмы блефовать и попробовать свои силы в покер, не трогая карты, под катом.

Читать полностью »

image

Доброго времени суток всем! Несколько дней назад была опубликована статья на GeekTimes: «Взять и победить: ИИ выиграл покерный турнир у четырех профи» и я хочу немного оспорить значимость этой победы.

Прежде всего хочу сказать, что я внимательно следил за происходящими событиями. Мне даже удалось получить ответы на интересующие вопросы от Carnegie Mellon University и профессионального игрока Джейсона Леса. Вообще к теме победы ИИ в покере отношусь очень серьёзно. Это не шахматы или какие-нибудь нарды, где компьютер способен намного оперативние просчитывать видимые ходы и вероятности.

В большинстве своём люди учатся на собственных ошибках. Редко когда на чужих. Общество совершает одни и те же ошибки снова и снова. Искусственный интелект развивается подругому. Если автопилот допускает ошибку, остальные самоуправляемые машины станут умнее. Все новопроизведенные автомобили будут созданы с полным набором навыков своих предков. Таким образом коллективное обучение ИИ, может происходить быстрее, чем у людей — Эрик Шмидт, Себастьян Трун.

Читать полностью »

ИИ: блеф, отъем денег у населения и победа над неопределенностью - 1

Прямо сейчас, пока вы читаете эти строки, в мире происходит удивительное событие — искусственный интеллект побеждает человека в очередной игре. Удивителен не сам факт превосходства машин, а то, что об этом мало пишут. Возможно, в связи с тем, что на этот раз машина состязается не в легендарную игру «го», не в DOOM, лапту или прятки, а в спортивный карточный покер.

Покер часто пренебрежительно называют азартной игрой, выигрыш в которой зависит исключительно от случая, но его на сегодняшний день в законодательном порядке признали официальным видом спорта в целом ряде стран (за исключением России). Самое интересное для нас и машин в том, что в покере выигрышные стратегии можно спрогнозировать при помощи теории вероятности. И самое главное, покер — это игра с неполной информацией, в отличие от шахмат, шашек, нард, где оба игрока видят положение всех фигур на доске. Ранее ИИ не мог победить там, где присутствует элемент неопределенности. Так что же изменилось?
Читать полностью »

Покерная программа DeepStack обыгрывает профессионалов один на один - 1
Дерево решений программы DeepStack в хедс-апе (игре один на один) безлимитного холдема на префлопе, флопе и тёрне

Пионер современной теории игр Джон фон Нейман говорил: «Реальная жизнь вся состоит из блефа, из маленьких приёмов обмана, из размышлений о том, каких действий ожидает от тебя другой человек. Вот что представляет игра в моей теории» (цитата из 13-й серии документального сериала «Возвышение человечества»).

Другими словами, Джон фон Нейман предвидел, что для создания сильного ИИ компьютер должен научиться играть в игры с неполной информацией, которые наиболее соответствуют человеческому поведению в реальной жизни. Такие игры как покер.
Читать полностью »


Первое видео курса

Массачусетский технологический институт выложил в свободный доступ курс лекций по теме «Теория и аналитика игры в покер» (на английском языке). Доступны видеолекции, конспекты и специальные заметки по курсу. Это событие – часть программы OpenCourseWare, которая посвящена организации бесплатного доступа к избранным лекциям института для всех желающих – даже для тех, кто не учится в нём.

Помните, как в школе многие говорят: «Ну зачем мы это учим, нам это не пригодится!»?

Так вот, лекции по покеру – пожалуй, могут оказаться не просто интересными, но и весьма полезными с практической точки зрения.

Лекции ведёт магистрант института Кевин Дезмонд, который получил степень бакалавра по финансам. И, что логично, его лекции как раз рассказывают о технологиях анализа и планирования, предназначенных для максимизации выгоды от игры на деньги.

В курсе рассматриваются основы игры, наилучшие стратегии, и те важные детали, которые самоучки обычно упускают. Рассматривается анализ поведения игроков, манеры игры и прогнозы их будущих действий в зависимости от предыдущих раздач.
Читать полностью »

«Победа» профессионалов над покерной программой статистически является ничьей - 1
Туомас Сандхолм (Tuomas Sandholm), профессор компьютерных наук университета Карнеги-Меллона, ведущий разработчик компьютерной программы Claudico

8 мая завершился необычный покерный турнир, в котором четверым из Топ-10 лучших игроков в техасский холдем противостояла компьютерная программа Claudico. Результат соревнования “Brains Vs. Artificial Intelligence” оказался в пользу людей: у них был положительный баланс по итогам 20 000 раздач в двусторонней игре.

Тем не менее, фактическая победа не означает, что на самом деле люди сильнее ИИ в покере. Эксперты в области таких соревнований объясняют, что сыгранных рук и результата недостаточно для формального определения победителя, так что де-факто результатом стала «статистическая ничья».
Читать полностью »

Четверо лучших в мире игроков в покер соревнуются с программой под названием Claudico на чемпионате «Brains Vs. Artificial Intelligence» в казино в Питтсбурге. В течение двух недель программа сыграет в Техасский холдем один на один с живыми игроками.

Живые участники чемпионата пока выигрывают.

image
Дуг Полк против Claudico
Читать полностью »

Покер на рабочем месте

За более чем десять лет моих активных поисков и применения GTD/PM-методик в своей, без малого, десятилетней практике фрилансера и предпринимателя, до меня наконец дошло — серебряной пули нет. Многие знали об этом всегда, мне же понадобились годы. Когда для тебя одновременное количество проектов измеряется не одним десятком. Когда ты прокрастинатор настолько, что даже прокрастинируя этой статьей от работы умудряешься прокрастинировать прокрастинацию чтением писем Лейбница и готов прокрастинировать рекурсивно. Когда ты перфекционист шестого разряда и программист-романтик, то до последнего надеешься, что есть универсальное лекарство. Но его нет…

Было бы счастье, да… многолетние поиски философского камня принесли и свои плоды. У меня накопился большой сундук различных подходов, которыми я хочу поделиться.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js