Почему этой зимой мы снова приглашаем всех поиграть в компьютерные игры при помощи искусственного интеллекта

в 13:03, , рубрики: deep learning, gpgpu, reinforcement learning, Блог компании Московский физико-технический институт (МФТИ), искусственный интеллект, компьютерные игры, машинное обучение, МФТИ, ненормальное программирование, Спортивное программирование, хакатон

Хабр, МФТИ приветствует тебя! Как истинные технари, сразу переходим к делу и приглашаем всех, кому интересно, принять участие в новом хакатоне DeepHack, который пройдет на Физтехе с 6 по 12 февраля. Отборочный этап уже начался и продлится до 22 января. Это мы всё к чему… Если вы не понаслышке знаете, что такое DQN, deep RL и DeepHack сразу регистрируйтесь на очередную научную школу-хакатон — rl.deephack.me.

DeepHack

А если вы не до конца в теме и вам, например, не ясно, почему компьютерные игры, какое отношение они имеют к управлению дата-центрами и что на самом деле будет в феврале, то срочно идите под кат — там максимальное погружение в жизнь искусственного интеллекта от древности и до наших дней. Ну вы же не думаете, что всё это изобрели только в XXI веке?

Шпаргалка читателю: DeepHack — формат, совмещающий в себе классический хакатон с пиццей, кока-колой и круглосуточным кодингом и научную школу с лекциями от ведущих специалистов по теме. Что рассказывали на прошлых хакатонах и какие получились результаты, можно узнать на сайтах game.deephack.me и qa.deephack.me.

Введение

Углубимся в историю. Как вы знаете, первые попытки создать искусственный интеллект начались очень давно. Ответ на вопрос, насколько давно, сильно зависит от того, что именно мы вкладываем в понятие “искусственный интеллект”. Мы будем считать, что искусственный интеллект — некоторая машина, способная с помощью логических вычислений принимать решения. Такое определение позволит нам пропустить все (безусловно, очень интересные) попытки создать искусственный интеллект в Древности, Античности, Средневековье и Новом Времени, сразу перескочив в 19-ый век к Чарльзу Бэббиджу и Аде Лавлейс. Они широко известны, как создатель вычислительной машины и первый программист соответственно. Но не будем задерживаться здесь и пойдем даже еще дальше — в начало века 20-ого, когда Давид Гильберт, ставший после смерти Анри Пуанкаре общепризнанным математиком №1, поставил перед мировым математическим сообществом вопрос: “могут ли быть все математические рассуждения формализованы?” Ответ на этот вопрос дали другие теперь известные ученые: Курт Гёдель со своей теоремой о неполноте (1931 год), Алан Тьюринг, предложивший машину имени себя (1936) и Алонзо Чёрч, придумавший λ-исчисление (серия работ в 1930-ых). Работы Гёделя продемонстрировали, что математическая логика имеет свои границы. Но результаты Тьюринга-Чёрча показали, что все то, что математическая логика в состоянии описать, может быть формализовано и выполнено машиной.

В 1943 году вышла работа, положившая основу всем современным чудесам, которые демонстрируют нейронные сети (например, способность отличать кошек от собак на сверхчеловеческом уровне): «Логическое исчисление идей, относящихся к нервной активности» авторства Уоррена Маккалока и Уолтера Питтса. В частности, они предложили формальную модель нейрона. Прошло немного времени, и Алан Тьюринг предложил знаменитый тест имени себя — тест на проверку создания искусственного интеллекта. А годом позже, в 1951-ом, Марвин Мински построил первую нейросетевую машину (SNARC).

Основным проблемами искусственного интеллекта были недостаток вычислительной мощности машин и так называемый парадокс Моравека (Hans Moravec): “Почему сложные задачи, вроде доказательства теорем, просты для компьютера, а простые, вроде узнавания лиц, сложны?”

Возрождение интереса к ИИ

До недавнего времени особого интереса к ИИ, как к полю для исследовательской деятельности не наблюдалось, но закон Мура, исправно работавший с 1965 года, дал о себе знать. Первым предвестником новой весны, пожалуй, стала, победа компьютера Deep Blue в шахматной битве с тогдашним чемпионом мира Гарри Каспаровым в 1997 году. Кстати, в этом же году была опубликована работа Юргена Шмидхубера Long Short-Term Memory (Длинная краткосрочная память), заложившая основы современного поколения рекуррентных сетей.

Дальше побед в копилке ИИ становилось только больше. Например, последняя общеизвестная победа в игре го принадлежит программе AlphaGo. Но и до этого поступь искусственного интеллекта была слышна: получение сверхчеловеческого качества в классификации картинок на 1000 классов (ImageNet), распознавании речи (ByteNet) и доказательство математических теорем (множество специализированных пакетов). Новый период расцвета ИИ пришелся на 2000-ые годы и продолжается до сих пор.

Ключевая задача ИИ — управление поведением

В 90-е становилась все более распространенной концепция “интеллектуального агента”, который принимает решение о своем поведении на основании данных из окружающего мира. Попытки делать таких агентов начались еще в глубокой древности, но только с развитием достаточно мощности вычислительных машин (мы помним про закон Мура) такие агенты получили распространение. Сейчас интеллектуальные агенты управляют торгами на биржах, сажают самолеты и могут вести ваш автомобиль за вас (сразу в голову приходит беспилотная Tesla, но и обычный круиз-контроль тоже можно считать таким агентом).

История DeepMind и Atari, как песочница для ИИ

От реальных задач переходим к задачам нереальным, а именно — компьютерным играм. И тут на сцену вступает Дэмис Хасабис (Demis Hassabis) — исследователь в области ИИ, разработчик игр и игрок в шахматы. В 2010-ом году он основал компанию DeepMind. Дэмис, будучи разработчиком игр, сохранил интерес к ним и занимаясь искусственным интеллектом. Так, в 2012 году появились первые результаты побед интеллектуальных агентов в играх для приставок Atari. На просторах бывшего СССР эти приставки не получили распространения, но приставка Dendi имеет близкие вычислительные возможности и множество портированных с Atari игр, например, Galaxy / Space Invaders. В 2014-ом году компания была приобретена Google, но Дэмис сохранил свой руководящий пост и продолжил движение в том же направлении. В 2015-ом году очередной вехой стала публикация в журнале Nature. Google же нашла применение полученным результатам и в реальности — например, для управления электропитанием своих дата-центров.

Переход на открытую науку

Мы уже упоминали Tesla, стоит упомянуть и её основателя — Илона Маск, который помимо прочих занятий в 2015 году стал одним из сооснователей института OpenAI, целью которого является создание искусственного интеллекта. Почему в названии присутствует “open”? Илон Маск постулирует, что потенциальный риск создания искусственного интеллекта (довольно неплохо проиллюстрированный в теперь уже классическом фильме “Терминатор” с Арнольдом Шварценеггером, снятом в 1984-ом, еще до начала сегодняшнего всплеска интереса к ИИ) может быть уменьшен, если все получат равный доступ к результатам исследований искусственного интеллекта. Не совсем очевидная стратегия, но можно вспомнить ученых-участников Манхэттенского проекта, передававших чертежи атомной бомбы СССР для избежания опасного дисбаланса вооружений.

Уже через несколько месяцев после создания, в апреле 2016-ого года, OpenAI запустил общедоступную платформу gym (“тренажерный зал”), на которой каждый может опробовать свои алгоритмы для решения задач интеллектуальных агентов в различных окружениях — вроде передвижения кубика в нужное место комнаты или удержания шеста в вертикальном положении. Еще через полгода в gym добавляют игры Atari — и теперь любой может посоревноваться со специалистами DeepMind в умении обучать интеллектуальных агентов играть в компьютерные игры.

История хакатонов DeepHack

Но еще до того, как это стало возможным, появилась идея попробовать свои силы в соревновании ИИ на Atari. Так родился первый хакатон DeepHack, который состоялся летом 2015-ого года.

Совместно с хакатоном было решено провести научную школу, чтобы лекции и общение с лекторами помогли бы участникам хакатона продвинуться дальше и превзойти результаты DeepMind. Забегая вперед, можно сказать, что в какой-то мере это удалось: одна из команд даже опубликовала научную работу по результатам хакатона. Лекторами на первом хакатоне DeepHack выступили: Юрген Шмидхубер (Juergen Schmidhuber) — кажется, что этот человек не нуждается в представлении, достаточно сказать, что он считается одним из отцов современных нейронных сетей и является руководителем группы в швейцарском институте по исследовании ИИ, Йошуа Бенжио (Yoshua Bengio) — еще один из отцов современных нейронных сетей, руководитель лаборатории по исследованию ИИ в университете Торонто, Руслан Салахутдинов, глава исследовательского подразделения компании Apple, профессор в университете Карнеги-Меллон, а также многие другие. Подробно посмотреть список участников, записи лекций и слайды можно на сайте game.deephack.me.

Второй DeepHack

Через полгода, зимой 2016-ого, мы решили переключиться на не менее интересную задачу — ответы на вопросы для американского аналога ЕГЭ. В это время начался всемирный конкурс Kaggle на данных, предоставленных исследовательским институтом Аллена в области ИИ (Allen Institute for Artificial Intelligence), основанным Полом Алленом (Paul Allen, сооснователь компании Microsoft) в 2013-ом году.

Здесь также работала научная школа, куда были приглашены ведущие ученые в области обработки естественного языка: Кристофер Мэннинг (Christopher Manning), профессор Стэнфордского университета, автор классической книги “Основы статистической обработки естественного языка”, Томаш Миколов (Tomas Mikolov), исследователь ИИ в Facebook, автор word2vec, Фил Блансом (Phil Blunsom), профессор Оксфордского университета, исследователь в DeepMind. И опять, многие другие — подробности на qa.deephack.me.

Новый DeepHack

Для нового DeepHack, который пройдет 6-12 февраля 2017-ого года был выбран OpenAI gym, как общедоступная платформа, и в качестве задачи — сложные с точки зрения машины игры, вроде Пакмана (мы помним про парадокс Моравека). В рамках хакатона снова будет работать научная школа, лекции сможет посетить любой желающий. Лекторы будут объявлены позже, все обновления можно отслеживать на rl.deephack.me. Но уже сейчас объявляется отборочный тур для участия в хакатоне: нужно добиться лучших результатов в игре Skiing на Atari. Первые 8 команд будут отобраны для участия, итоги отборочного тура будут подведены 22 января 2017-ого года. Будем рады видеть вас на хакатоне и научной школе!

Автор:

Источник

Поделиться

* - обязательные к заполнению поля