- PVSM.RU - https://www.pvsm.ru -

Ученые вылечили ИИ от забывчивости

Искусственные нейронные сети отличаются от биологических аналогов неспособностью «запомнить» прошлые навыки при обучении новой задаче. Искусственный интеллект, натренированный [1] на распознавание собак, не сможет различать людей. Для этого его придется переобучить, однако при этом сеть «забудет» о существовании собак. То же касается и игр – ИИ, умеющий играть в покер, не выиграет в шахматы.

Эта особенность называется «катастрофической забывчивостью» (catastrophic forgetting). Однако ученые из компании DeepMind и Имперского колледжа Лондона разработали алгоритм обучения глубоких нейронных сетей, который способен приобретать новые навыки, сохраняя «память» о предыдущих задачах.

Ученые вылечили ИИ от забывчивости - 1 [2]/ фото Dean Hochman [3] CC [4]

Нейронная сеть состоит из нескольких связей, для каждой из которых вычисляется её вес. Каждому весу в нейронной сети присваивается [5] параметр F, который определяет его значимость. Чем больше значение F для конкретного нейрона, тем меньше вероятность его замены при дальнейшем обучении. Поэтому нейронная сеть как бы «запоминает» наиболее важные приобретенные навыки.

Методика получила название Elastic Weight Consolidation, или «упругое закрепление весов». Работа алгоритма тестировалась на играх Atari. Ученые показали, что без «закрепления весов» программа быстро забывала игры, когда переставала в них играть (синий график). При использовании алгоритма EWC нейросеть «запомнила» веса, необходимые для выполнения всех предыдущих задач. И хотя EWC-сеть проиграла в каждом отдельном случае классическому алгоритму, она продемонстрировала хорошие результаты по сумме всех этапов (красный и коричневый графики).

Ученые вылечили ИИ от забывчивости - 2

Авторы исследования рассказывают, что ученое сообщество уже предпринимало попытки создания глубоких нейронных сетей, способных выполнять сразу несколько задач. Однако прошлые решения были или недостаточно мощными, или же требовали больших вычислительных ресурсов, поскольку сети обучались сразу на крупной объединенной выборке (а не на нескольких последовательных). Такой подход не приближал алгоритмы к принципам работы человеческого мозга [6].

Еще есть альтернативные архитектуры нейронных сетей для работы с текстом, музыкой и сериями длинных данных. Они носят название рекуррентных [10] и имеют долгосрочную и краткосрочную память, что позволяет переключаться с глобальных проблем на локальные (например, с анализа отдельных слов на правила стилистики языка в целом).

Рекуррентные нейронные сети имеют память, однако уступают глубоким сетям в способности анализировать сложные наборы признаков, которые встречаются, например, при обработке графики. Поэтому новое решение от DeepMind в перспективе позволит создавать умные универсальные алгоритмы, которые найдут применение в программном обеспечении для решения задач, требующих нелинейных преобразований.

P.S. Еще несколько интересных материалов из нашего блога:

Автор: ИТ-ГРАД

Источник [17]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/blog-kompanii-it-grad/250935

Ссылки в тексте:

[1] натренированный: http://siliconangle.com/blog/2017/03/16/googles-deepmind-overcomes-rather-tricky-problem-forgetfulness/

[2] Image: https://habrahabr.ru/company/it-grad/blog/323948/

[3] Dean Hochman: https://www.flickr.com/photos/deanhochman/8540480427/

[4] CC: https://creativecommons.org/licenses/by/2.0/

[5] присваивается: http://www.pnas.org/content/early/2017/03/13/1611835114.abstract?sid=7259005f-fc4f-443b-bbc0-0ab295eaa003

[6] мозга: http://www.braintools.ru

[7] Image: https://habrahabr.ru/company/it-grad/blog/321130/

[8] Image: https://habrahabr.ru/company/it-grad/blog/309024/

[9] Image: https://habrahabr.ru/company/it-grad/blog/306220/

[10] рекуррентных: https://nplus1.ru/material/2016/11/04/recurrent-networks

[11] Unboxing all-flash СХД NetApp AFF A300: технические характеристики и взгляд изнутри: http://iaas-blog.it-grad.ru/unboxing-all-flash-схд-netapp-aff-a300-технические-характеристики-и-взгляд-изнутри

[12] Stretch Deploy для vCloud Connector: функциональные особенности и принцип работы: http://iaas-blog.it-grad.ru/stretch-deploy-для-vcloud-connector-функциональные-особенности-и-принцип-работы

[13] Три причины, почему использовать VMware vSphere 6.0 по-прежнему актуально: http://iaas-blog.it-grad.ru/три-причины-почему-использовать-vmware-vsphere-6.0-по-прежнему-актуально

[14] Облачные технологии для решения задач в строительном бизнесе: http://iaas-blog.it-grad.ru/облачные-технологии-для-решения-задач-в-строительном-бизнесе

[15] Технико-экономическое обоснование использования услуги IaaS на примере кейса крупной компании: http://iaas-blog.it-grad.ru/технико-экономическое-обоснование-использования-услуги-iaas-на-примере-кейса-крупной-компании

[16] X-as-a-services: как не погрязнуть в аббревиатурах облачных услуг: http://iaas-blog.it-grad.ru/x-as-a-services-как-не-погрязнуть-в-аббревиатурах-облачных-услуг

[17] Источник: https://habrahabr.ru/post/323948/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best