Заглянуть в черный ящик — новая система от MIT покажет, как работают алгоритмы машинного обучения

В MIT представили интерактивный инструмент, который дает понять, почему интеллектуальная система принимает то или иное решение. В этом материале — о том, как он работает.

^[1]
/ Unsplash / Randy Fath ^[2]

Проблема черного ящика

Автоматизированные системы машинного обучения (AutoML) многократно тестируют и модифицируют алгоритмы и их параметры. Используя метод обучения с подкреплением ^[3], такие системы выбирают ^[4] ИИ-модели, которые больше других подходят для решения той или иной задачи. Например, для автоматизации службы технической поддержки ^[5]. Но AutoML-системы действуют как черные ящики, то есть их методы скрыты от пользователей.

Эта особенность значительно усложняет отладку алгоритмов машинного обучения. И, например, в случае с системами автопилотирования, последствия могут быть фатальными. В 2016 году Tesla на автопилоте впервые стала ^[6] участником смертельного ДТП, столкнувшись с большим грузовиком. Причина аварии достоверно неизвестна. У экспертов есть только предположение — алгоритм перепутал ^[7] высокий грузовик с дорожным знаком, установленном на нижнем крае эстакады. И ошибку до сих пор не устранили — в начале марта в США вновь произошла аналогичная авария ^[8].

Чтобы объяснить, как машинный алгоритм пришел к тому или иному выводу, инженеры используют ^[9] апостериорные методики или интерпретируемые модели вроде деревьев решений ^[10]. В первом случае входные и выходные данные используют для аппроксимации «мыслительного процесса» алгоритма. Точность таких методик оставляет желать лучшего.

Деревья решений — более точный подход, но работает только с категорированными данными ^[11]. Поэтому для сложных проблем компьютерного зрения неудобен.

Исправить ситуацию решили инженеры из MIT, Гонконгского университета науки и технологии и Чжэцзянского университета. Они представили ^[12] инструмент для визуализации процессов, происходящих внутри черного ящика. Его назвали ATMSeer.

Как работает система

ATMSeer построен на базе Auto-Tuned Models ^[13] (ATM). Это — автоматизированная система машинного обучения, которая ищет наиболее эффективные модели для решения конкретных задач (например, поиск объектов). Система произвольным образом выбирает тип алгоритма — нейросеть, деревья решений, «случайный лес ^[14]» или логистическая регрессия. Таким же образом определяет гиперпараметры модели — размер дерева или число слоев нейронной сети.

ATM проводит серию экспериментов с тестовыми данными, автоматически подстраивая гиперпараметры и оценивая производительность. На основе этой информации она выбирает следующую модель, которая может показать лучшие результаты.

Каждая модель представляется в виде своеобразной «единицы информации» с переменными: алгоритм, гиперпараметры, производительность. Переменные отображаются на соответствующих графиках и схемах. Далее, инженеры могут вручную править эти параметры и в реальном времени мониторить изменения в интеллектуальной системе.

Интерфейс инструмента инженеры MIT показали в следующем видео ^[15]. В нем же они разобрали несколько юзкейсов.

Контрольная панель ATMSeer дает возможность ^[16] управлять процессом обучения и загружать новые своды данных. Там же отображаются показатели производительности всех моделей по шкале от нуля до десяти.

Перспективы

Инженеры говорят, что новый инструмент поспособствует развитию области машинного обучения, сделав работу с интеллектуальными алгоритмами более прозрачной. Ряд специалистов по МО уже отметили ^[12], что с ATMSeer они более уверены в корректности своих моделей, сгенерированных AutoML.

Также новая система поможет компаниям удовлетворить требования GDPR. Общий регламент по защите данных требует от алгоритмов машинного обучения прозрачности ^[17]. Разработчики интеллектуальной системы должны быть в состоянии объяснить принимаемые алгоритмами решения. Это нужно ^[18] для того, чтобы пользователи в полной мере могли понять, как система обрабатывает их персональные данные.

Заглянуть в черный ящик — новая система от MIT покажет, как работают алгоритмы машинного обучения - 2
/ Unsplash / Esther Jiao ^[19]

В будущем можно ожидать появления большего числа инструментов, позволяющих заглянуть в черный ящик. К примеру, инженеры из MIT уже работают ^[9] над еще одним решением. Оно поможет студентам-медикам тренировать навыки составления анамнеза.

Кроме MIT, в этой области работает IBM. Совместно с коллегами из Гарварда они представили инструмент Seq2Seq-Vis. Он визуализирует ^[20] процесс принятия решений при машинном переводе с одного языка на другой. Система показывает, как каждое слово в исходном и конечном тексте связано с примерами, на которых обучалась нейросеть. Так, проще определить, произошла ли ошибка из-за неправильных исходных данных или алгоритма поиска.

Инструменты, которые делают алгоритмы машинного обучения более прозрачными, также найдут применение в сфере ITSM ^[21] при внедрении службы Service Desk. Системы помогут с обучением интеллектуальных чат-ботов, и позволят избежать ситуаций, когда те ведут себя не так, как задумано ^[22].

Материалы из нашего корпоративного блога:

Управление ИТ-проектами – 5 вызовов и их преодоление ^[23]

Искусственный интеллект классифицирует запросы в ServiceNow ^[24]

IT Operations Management: как управлять ИТ-инфраструктурой ^[25]

И блога на Хабре:

Agent Intelligence от ServiceNow — нейронные сети на службе у техподдержки ^[26]

Знакомство с ITSM: 10 хабратопиков и экспертных материалов для «погружения» в тему ^[27]

Автор: it-guild

Источник ^[28]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/algoritmy/323076

Ссылки в тексте:

[1] Image: https://habr.com/ru/company/it-guild/blog/459030/

[2] Randy Fath: https://unsplash.com/photos/pb-knn4RlnA

[3] обучения с подкреплением: https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D1%81_%D0%BF%D0%BE%D0%B4%D0%BA%D1%80%D0%B5%D0%BF%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC

[4] выбирают: https://www.fastcompany.com/90152427/googles-new-ai-designs-ai-better-than-humans

[5] службы технической поддержки: https://it-guild.com/services/implementation/servicedesk/

[6] стала: https://www.theguardian.com/technology/2016/jun/30/tesla-autopilot-death-self-driving-car-elon-musk

[7] перепутал: https://electrek.co/2016/07/01/understanding-fatal-tesla-accident-autopilot-nhtsa-probe/

[8] произошла аналогичная авария: https://electrek.co/2019/03/01/tesla-driver-crash-truck-trailer-autopilot/

[9] используют: http://news.mit.edu/2018/mit-lincoln-laboratory-adaptable-interpretable-machine-learning-0905

[10] деревьев решений: https://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%80%D0%B5%D0%B2%D0%BE_%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D0%B9

[11] категорированными данными: https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B5%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%B0%D1%8F

[12] представили: http://news.mit.edu/2019/atmseer-machine-learning-black-box-0531

[13] Auto-Tuned Models: https://github.com/HDI-Project/ATM

[14] случайный лес: https://ru.wikipedia.org/wiki/Random_forest

[15] в следующем видео: https://www.youtube.com/watch?v=4g2XTCkGsp8

[16] дает возможность: https://www.analyticsindiamag.com/mit-atmseer-black-box-model-transparency/

[17] прозрачности: https://www.technologyreview.com/s/604087/the-dark-secret-at-the-heart-of-ai/

[18] нужно: https://iapp.org/news/a/is-there-a-right-to-explanation-for-machine-learning-in-the-gdpr/

[19] Esther Jiao: https://unsplash.com/photos/ADv0GiMBlmI

[20] визуализирует: https://venturebeat.com/2018/11/01/ibm-harvard-develop-tool-to-tackle-black-box-problem-in-ai-translation/

[21] ITSM: https://it-guild.com/services/implementation/itsm/

[22] ведут себя не так, как задумано: https://techcrunch.com/2016/03/24/microsoft-silences-its-new-a-i-bot-tay-after-twitter-users-teach-it-racism/

[23] Управление ИТ-проектами – 5 вызовов и их преодоление: https://it-guild.com/info/blog/upravlenie-it-proektami-5-vyzovov-i-ikh-preodolenie/

[24] Искусственный интеллект классифицирует запросы в ServiceNow: https://it-guild.com/info/blog/iskusstvennyy-intellekt-dlya-klassifikatsii-zaprosov-v-servicenow/

[25] IT Operations Management: как управлять ИТ-инфраструктурой: https://it-guild.com/info/blog/it-operations-management-upravlenie-it-infrastrukturoy/

[26] Agent Intelligence от ServiceNow — нейронные сети на службе у техподдержки: https://habr.com/ru/company/it-guild/blog/340682/

[27] Знакомство с ITSM: 10 хабратопиков и экспертных материалов для «погружения» в тему: https://habr.com/ru/company/it-guild/blog/453422/

[28] Источник: https://habr.com/ru/post/459030/?utm_source=habrahabr&utm_medium=rss&utm_campaign=459030

Нажмите здесь для печати.