Система AlphaGo выиграла третью, решающую игру у Ли Седоля

Третья победа искусственного интеллекта в исторической серии из пяти игр в го

^[1]Го — восточноазиатская логическая игра с древней историей и богатыми культурными традициями. Существует несколько правил и вариаций, но основная цель одна: каждому из двух игроков нужно отгородить камнями своего цвета территорию как можно большего размера. Исследователей искусственного интеллекта в го привлекает сложность. Покорять шахматы уже поздно — компьютеры уже несколько лет как играют лучше людей. А вот в го число возможных позиций куда выше (10¹⁰⁰), чем в шахматах. Современные программы играют неплохо, но на уровне го-любителей. До создания системы, которая сможет обыгрывать лучших из людей, в лучшем случае десяток лет.

Так эксперты говорили до появления AlphaGo. Разработка от DeepMind (в 2014 году компанию купила Google) использует метод Монте-Карло. Лучшие из современных систем компьютерного го используют эту технологию. Но в AlphaGo ходы также помогают выбрать нейросети политики и ценности. Их можно назвать близкими родственниками нейросетей, которые распознают изображения и речь. Систему сначала научили игре на 160 тысячах партий с сервера KGS. Затем AlphaGo тренировалась в играх против самой себя.

Впервые внимание этот образец ИИ привлёк в январе. Тогда Google опубликовала ^[2] научную работу по AlphaGo, где упоминался матч октября 2015 года. Трёхкратный европейский чемпион Фань Хуэй проиграл новой разработке в пяти играх из пяти.

Считается, что европейский уровень владения го ниже, чем на родине игры, в Азии. Вызывали вопросы отдельные ходы и ошибки Хуэя. Поэтому игроки го и энтузиасты ИИ с нетерпением ждали сеульского матча AlphaGo против одного из лучших представителей команды людей — обладателя девятого профессионального дана Ли Седоля ^[3].

До марта вопрос стоял следующим образом: есть ли у AlphaGo шанс против Ли Седоля ^[4]? Но Седоль проиграл как первую ^[5], так и вторую ^[6] партии. Если после первой игры мастер девятого дана демонстрировал оптимизм, то после второй он ушел ^[7] в смятении. Седоль заявил, что он не увидел моментов, где он вёл игру.

Сегодня прошла третья партия. На игре присутствовали ^[8] бывший глава Google Эрик Шмидт, один из важных инженеров компании Джефф Дин и прилетевший на днях в Сеул Сергей Брин. Очевидно, что покорение го символизирует важность технологий машинного обучения, которые являются сердцем Google.

^[9]
Слева направо: основатель DeepMind Демис Хассабис, обладатель девятого профессионального дана Ли Седоль, сооснователь Google Сергей Брин.

Как и в первой игре, Седоль ходил чёрными, то есть первым. Также к числу хороших моментов можно было бы отнести знакомство с системой — у инженеров DeepMind вряд ли есть ресурсы менять что-то в дни матча. По крайней мере, слух утверждает ^[10], что Седоль и команда экспертов го провела ночь в поисках слабостей AlphaGo. Первые ходы чёрных были агрессивными. Похоже, что Седоль пытался увести игру в другое направление, пытаясь надавить на слабые места системы.

Видеозапись трансляции третьей партии матча AlphaGo — Ли Седоль.

На 19 ходу AlphaGo повергла оппонента в ступор. Седолю потребовалось пятнадцать минут на обдумывание следующего хода. В процессе игры ИИ продемонстрировал умение работать со сложными моментами в виде позиций ко. Считается, что системы компьютерного го слабо справляются с ко. К концу третьей игры у чёрных кончилось время, поэтому ходы человеку пришлось обдумывать по минуте.

Через 176 ходов партия закончилась ^[11] победой системы AlphaGo. У ИИ на часах оставались 8 минут и 31 секунда.

^[12]

Это уже третья подряд победа AlphaGo в серии. Определён общий исход исторической серии из пяти игр. Определена судьба денежного вознаграждения — очевидно, что теперь он уйдёт на благотворительность и развитие го, как и задумывалось в случае поражения человека. Определять глубину демонстрации преимущества AlphaGo будут две последние игры в воскресенье и вторник — несмотря на ясный вывод серии, её всё равно доиграют.

#AlphaGo ^[13] won game 3 and the match! Historic moment. In complete awe of Lee Sedol’s incredible genius, and proud of the amazing AlphaGo team!

— Demis Hassabis (@demishassabis) 12 марта 2016 г. ^[14]

В прошлом марте система обыграла игрока второго профессионального дана, сегодня она обходит про девятого дана. Возможно, этому помог факт того, что последние пять месяцев система AlphaGo тренировалась в играх против самой себя. Как утверждает ^[15] глава DeepMind Демис Хассабис, текущая конфигурация использует примерно столько же аппаратных ресурсов, что и вариант, который обыграл Фань Хуэя. Хассабис говорит ^[16], что важнее алгоритмы, а не «железо».

Во вторник пройдёт последняя, пятая игра. Тогда будут подведены итоги сражения тысяч лет человеческого опыта игры в го и двухлетней разработки, запускаемой на кластере из нескольких десятков коммерчески доступных серверных процессоров графических ускорителей.

Полезные материалы по теме:

Канал DeepMind с трансляциями игр на YouTube ^[17]. Комментируют на английском Майкл Редмонд (9 профессиональный дан) и Крис Гэрлок.
Опубликованный вчера обзор алгоритмов AlphaGo на «Хабре» ^[18]

Автор: atomlib

Источник ^[19]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/google/114770

Ссылки в тексте:

[1] Image: https://habrastorage.org/files/e7d/ebb/4f8/e7debb4f856d4b9696a45f06658acc75.jpg

[2] опубликовала: https://geektimes.ru/post/269990/

[3] Ли Седоля: https://ru.wikipedia.org/wiki/%D0%9B%D0%B8_%D0%A1%D0%B5%D0%B4%D0%BE%D0%BB%D1%8C

[4] есть ли у AlphaGo шанс против Ли Седоля: https://geektimes.ru/post/270248/

[5] первую: https://geektimes.ru/post/272330/

[6] вторую: https://geektimes.ru/post/272398/

[7] ушел: http://phys.org/news/2016-03-human-champion-speechless-2nd-loss.html

[8] присутствовали: http://www.wired.com/2016/03/third-straight-win-googles-ai-claims-victory-historic-match-go-champ/

[9] Image: https://habrastorage.org/files/3e4/d05/5c8/3e4d055c883148d580ab82c483f7abef.jpg

[10] утверждает: http://www.cyberoro.com/news/news_view.oro?div_no=A1&num=521389&pageNo=1&cmt_n=0

[11] закончилась: http://googleasiapacific.blogspot.com/2016/03/alphagos-ultimate-challenge.html

[12] Image: https://habrastorage.org/files/6bd/db1/bce/6bddb1bce81f494ab1eac2a6c085e77a.png

[13] #AlphaGo: https://twitter.com/hashtag/AlphaGo?src=hash

[14] 12 марта 2016 г.: https://twitter.com/demishassabis/status/708567021122772992

[15] утверждает: https://twitter.com/demishassabis/status/708488229750591488

[16] говорит: https://twitter.com/demishassabis/status/708488741275312128

[17] Канал DeepMind с трансляциями игр на YouTube: https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A/videos?view=2&live_view=502&shelf_id=2&sort=dd

[18] Опубликованный вчера обзор алгоритмов AlphaGo на «Хабре»: https://habrahabr.ru/post/279071/

[19] Источник: https://geektimes.ru/post/272508/

Нажмите здесь для печати.