- PVSM.RU - https://www.pvsm.ru -
[1]Го — восточноазиатская логическая игра с древней историей и богатыми культурными традициями. Существует несколько правил и вариаций, но основная цель одна: каждому из двух игроков нужно отгородить камнями своего цвета территорию как можно большего размера. Исследователей искусственного интеллекта в го привлекает сложность. Покорять шахматы уже поздно — компьютеры уже несколько лет как играют лучше людей. А вот в го число возможных позиций куда выше (10100), чем в шахматах. Современные программы играют неплохо, но на уровне го-любителей. До создания системы, которая сможет обыгрывать лучших из людей, в лучшем случае десяток лет.
Так эксперты говорили до появления AlphaGo. Разработка от DeepMind (в 2014 году компанию купила Google) использует метод Монте-Карло. Лучшие из современных систем компьютерного го используют эту технологию. Но в AlphaGo ходы также помогают выбрать нейросети политики и ценности. Их можно назвать близкими родственниками нейросетей, которые распознают изображения и речь. Систему сначала научили игре на 160 тысячах партий с сервера KGS. Затем AlphaGo тренировалась в играх против самой себя.
Впервые внимание этот образец ИИ привлёк в январе. Тогда Google опубликовала [2] научную работу по AlphaGo, где упоминался матч октября 2015 года. Трёхкратный европейский чемпион Фань Хуэй проиграл новой разработке в пяти играх из пяти.
Считается, что европейский уровень владения го ниже, чем на родине игры, в Азии. Вызывали вопросы отдельные ходы и ошибки Хуэя. Поэтому игроки го и энтузиасты ИИ с нетерпением ждали сеульского матча AlphaGo против одного из лучших представителей команды людей — обладателя девятого профессионального дана Ли Седоля [3].
До марта вопрос стоял следующим образом: есть ли у AlphaGo шанс против Ли Седоля [4]? Но Седоль проиграл как первую [5], так и вторую [6] партии. Если после первой игры мастер девятого дана демонстрировал оптимизм, то после второй он ушел [7] в смятении. Седоль заявил, что он не увидел моментов, где он вёл игру.
Сегодня прошла третья партия. На игре присутствовали [8] бывший глава Google Эрик Шмидт, один из важных инженеров компании Джефф Дин и прилетевший на днях в Сеул Сергей Брин. Очевидно, что покорение го символизирует важность технологий машинного обучения, которые являются сердцем Google.
[9]
Слева направо: основатель DeepMind Демис Хассабис, обладатель девятого профессионального дана Ли Седоль, сооснователь Google Сергей Брин.
Как и в первой игре, Седоль ходил чёрными, то есть первым. Также к числу хороших моментов можно было бы отнести знакомство с системой — у инженеров DeepMind вряд ли есть ресурсы менять что-то в дни матча. По крайней мере, слух утверждает [10], что Седоль и команда экспертов го провела ночь в поисках слабостей AlphaGo. Первые ходы чёрных были агрессивными. Похоже, что Седоль пытался увести игру в другое направление, пытаясь надавить на слабые места системы.
Видеозапись трансляции третьей партии матча AlphaGo — Ли Седоль.
На 19 ходу AlphaGo повергла оппонента в ступор. Седолю потребовалось пятнадцать минут на обдумывание следующего хода. В процессе игры ИИ продемонстрировал умение работать со сложными моментами в виде позиций ко. Считается, что системы компьютерного го слабо справляются с ко. К концу третьей игры у чёрных кончилось время, поэтому ходы человеку пришлось обдумывать по минуте.
Через 176 ходов партия закончилась [11] победой системы AlphaGo. У ИИ на часах оставались 8 минут и 31 секунда.
Это уже третья подряд победа AlphaGo в серии. Определён общий исход исторической серии из пяти игр. Определена судьба денежного вознаграждения — очевидно, что теперь он уйдёт на благотворительность и развитие го, как и задумывалось в случае поражения человека. Определять глубину демонстрации преимущества AlphaGo будут две последние игры в воскресенье и вторник — несмотря на ясный вывод серии, её всё равно доиграют.
#AlphaGo [13] won game 3 and the match! Historic moment. In complete awe of Lee Sedol’s incredible genius, and proud of the amazing AlphaGo team!
— Demis Hassabis (@demishassabis) 12 марта 2016 г. [14]
В прошлом марте система обыграла игрока второго профессионального дана, сегодня она обходит про девятого дана. Возможно, этому помог факт того, что последние пять месяцев система AlphaGo тренировалась в играх против самой себя. Как утверждает [15] глава DeepMind Демис Хассабис, текущая конфигурация использует примерно столько же аппаратных ресурсов, что и вариант, который обыграл Фань Хуэя. Хассабис говорит [16], что важнее алгоритмы, а не «железо».
Во вторник пройдёт последняя, пятая игра. Тогда будут подведены итоги сражения тысяч лет человеческого опыта игры в го и двухлетней разработки, запускаемой на кластере из нескольких десятков коммерчески доступных серверных процессоров графических ускорителей.
Полезные материалы по теме:
Автор: atomlib
Источник [19]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/google/114770
Ссылки в тексте:
[1] Image: https://habrastorage.org/files/e7d/ebb/4f8/e7debb4f856d4b9696a45f06658acc75.jpg
[2] опубликовала: https://geektimes.ru/post/269990/
[3] Ли Седоля: https://ru.wikipedia.org/wiki/%D0%9B%D0%B8_%D0%A1%D0%B5%D0%B4%D0%BE%D0%BB%D1%8C
[4] есть ли у AlphaGo шанс против Ли Седоля: https://geektimes.ru/post/270248/
[5] первую: https://geektimes.ru/post/272330/
[6] вторую: https://geektimes.ru/post/272398/
[7] ушел: http://phys.org/news/2016-03-human-champion-speechless-2nd-loss.html
[8] присутствовали: http://www.wired.com/2016/03/third-straight-win-googles-ai-claims-victory-historic-match-go-champ/
[9] Image: https://habrastorage.org/files/3e4/d05/5c8/3e4d055c883148d580ab82c483f7abef.jpg
[10] утверждает: http://www.cyberoro.com/news/news_view.oro?div_no=A1&num=521389&pageNo=1&cmt_n=0
[11] закончилась: http://googleasiapacific.blogspot.com/2016/03/alphagos-ultimate-challenge.html
[12] Image: https://habrastorage.org/files/6bd/db1/bce/6bddb1bce81f494ab1eac2a6c085e77a.png
[13] #AlphaGo: https://twitter.com/hashtag/AlphaGo?src=hash
[14] 12 марта 2016 г.: https://twitter.com/demishassabis/status/708567021122772992
[15] утверждает: https://twitter.com/demishassabis/status/708488229750591488
[16] говорит: https://twitter.com/demishassabis/status/708488741275312128
[17] Канал DeepMind с трансляциями игр на YouTube: https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A/videos?view=2&live_view=502&shelf_id=2&sort=dd
[18] Опубликованный вчера обзор алгоритмов AlphaGo на «Хабре»: https://habrahabr.ru/post/279071/
[19] Источник: https://geektimes.ru/post/272508/
Нажмите здесь для печати.