- PVSM.RU - https://www.pvsm.ru -
В MIT представили интерактивный инструмент, который дает понять, почему интеллектуальная система принимает то или иное решение. В этом материале — о том, как он работает.
[1]
/ Unsplash / Randy Fath [2]
Автоматизированные системы машинного обучения (AutoML) многократно тестируют и модифицируют алгоритмы и их параметры. Используя метод обучения с подкреплением [3], такие системы выбирают [4] ИИ-модели, которые больше других подходят для решения той или иной задачи. Например, для автоматизации службы технической поддержки [5]. Но AutoML-системы действуют как черные ящики, то есть их методы скрыты от пользователей.
Эта особенность значительно усложняет отладку алгоритмов машинного обучения. И, например, в случае с системами автопилотирования, последствия могут быть фатальными. В 2016 году Tesla на автопилоте впервые стала [6] участником смертельного ДТП, столкнувшись с большим грузовиком. Причина аварии достоверно неизвестна. У экспертов есть только предположение — алгоритм перепутал [7] высокий грузовик с дорожным знаком, установленном на нижнем крае эстакады. И ошибку до сих пор не устранили — в начале марта в США вновь произошла аналогичная авария [8].
Чтобы объяснить, как машинный алгоритм пришел к тому или иному выводу, инженеры используют [9] апостериорные методики или интерпретируемые модели вроде деревьев решений [10]. В первом случае входные и выходные данные используют для аппроксимации «мыслительного процесса» алгоритма. Точность таких методик оставляет желать лучшего.
Деревья решений — более точный подход, но работает только с категорированными данными [11]. Поэтому для сложных проблем компьютерного зрения неудобен.
Исправить ситуацию решили инженеры из MIT, Гонконгского университета науки и технологии и Чжэцзянского университета. Они представили [12] инструмент для визуализации процессов, происходящих внутри черного ящика. Его назвали ATMSeer.
ATMSeer построен на базе Auto-Tuned Models [13] (ATM). Это — автоматизированная система машинного обучения, которая ищет наиболее эффективные модели для решения конкретных задач (например, поиск объектов). Система произвольным образом выбирает тип алгоритма — нейросеть, деревья решений, «случайный лес [14]» или логистическая регрессия. Таким же образом определяет гиперпараметры модели — размер дерева или число слоев нейронной сети.
ATM проводит серию экспериментов с тестовыми данными, автоматически подстраивая гиперпараметры и оценивая производительность. На основе этой информации она выбирает следующую модель, которая может показать лучшие результаты.
Каждая модель представляется в виде своеобразной «единицы информации» с переменными: алгоритм, гиперпараметры, производительность. Переменные отображаются на соответствующих графиках и схемах. Далее, инженеры могут вручную править эти параметры и в реальном времени мониторить изменения в интеллектуальной системе.
Интерфейс инструмента инженеры MIT показали в следующем видео [15]. В нем же они разобрали несколько юзкейсов.
Контрольная панель ATMSeer дает возможность [16] управлять процессом обучения и загружать новые своды данных. Там же отображаются показатели производительности всех моделей по шкале от нуля до десяти.
Инженеры говорят, что новый инструмент поспособствует развитию области машинного обучения, сделав работу с интеллектуальными алгоритмами более прозрачной. Ряд специалистов по МО уже отметили [12], что с ATMSeer они более уверены в корректности своих моделей, сгенерированных AutoML.
Также новая система поможет компаниям удовлетворить требования GDPR. Общий регламент по защите данных требует от алгоритмов машинного обучения прозрачности [17]. Разработчики интеллектуальной системы должны быть в состоянии объяснить принимаемые алгоритмами решения. Это нужно [18] для того, чтобы пользователи в полной мере могли понять, как система обрабатывает их персональные данные.
/ Unsplash / Esther Jiao [19]
В будущем можно ожидать появления большего числа инструментов, позволяющих заглянуть в черный ящик. К примеру, инженеры из MIT уже работают [9] над еще одним решением. Оно поможет студентам-медикам тренировать навыки составления анамнеза.
Кроме MIT, в этой области работает IBM. Совместно с коллегами из Гарварда они представили инструмент Seq2Seq-Vis. Он визуализирует [20] процесс принятия решений при машинном переводе с одного языка на другой. Система показывает, как каждое слово в исходном и конечном тексте связано с примерами, на которых обучалась нейросеть. Так, проще определить, произошла ли ошибка из-за неправильных исходных данных или алгоритма поиска.
Инструменты, которые делают алгоритмы машинного обучения более прозрачными, также найдут применение в сфере ITSM [21] при внедрении службы Service Desk. Системы помогут с обучением интеллектуальных чат-ботов, и позволят избежать ситуаций, когда те ведут себя не так, как задумано [22].
И блога на Хабре:
Автор: it-guild
Источник [28]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/algoritmy/323076
Ссылки в тексте:
[1] Image: https://habr.com/ru/company/it-guild/blog/459030/
[2] Randy Fath: https://unsplash.com/photos/pb-knn4RlnA
[3] обучения с подкреплением: https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5_%D1%81_%D0%BF%D0%BE%D0%B4%D0%BA%D1%80%D0%B5%D0%BF%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC
[4] выбирают: https://www.fastcompany.com/90152427/googles-new-ai-designs-ai-better-than-humans
[5] службы технической поддержки: https://it-guild.com/services/implementation/servicedesk/
[6] стала: https://www.theguardian.com/technology/2016/jun/30/tesla-autopilot-death-self-driving-car-elon-musk
[7] перепутал: https://electrek.co/2016/07/01/understanding-fatal-tesla-accident-autopilot-nhtsa-probe/
[8] произошла аналогичная авария: https://electrek.co/2019/03/01/tesla-driver-crash-truck-trailer-autopilot/
[9] используют: http://news.mit.edu/2018/mit-lincoln-laboratory-adaptable-interpretable-machine-learning-0905
[10] деревьев решений: https://ru.wikipedia.org/wiki/%D0%94%D0%B5%D1%80%D0%B5%D0%B2%D0%BE_%D1%80%D0%B5%D1%88%D0%B5%D0%BD%D0%B8%D0%B9
[11] категорированными данными: https://ru.wikipedia.org/wiki/%D0%9A%D0%B0%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%B5%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%B0%D1%8F
[12] представили: http://news.mit.edu/2019/atmseer-machine-learning-black-box-0531
[13] Auto-Tuned Models: https://github.com/HDI-Project/ATM
[14] случайный лес: https://ru.wikipedia.org/wiki/Random_forest
[15] в следующем видео: https://www.youtube.com/watch?v=4g2XTCkGsp8
[16] дает возможность: https://www.analyticsindiamag.com/mit-atmseer-black-box-model-transparency/
[17] прозрачности: https://www.technologyreview.com/s/604087/the-dark-secret-at-the-heart-of-ai/
[18] нужно: https://iapp.org/news/a/is-there-a-right-to-explanation-for-machine-learning-in-the-gdpr/
[19] Esther Jiao: https://unsplash.com/photos/ADv0GiMBlmI
[20] визуализирует: https://venturebeat.com/2018/11/01/ibm-harvard-develop-tool-to-tackle-black-box-problem-in-ai-translation/
[21] ITSM: https://it-guild.com/services/implementation/itsm/
[22] ведут себя не так, как задумано: https://techcrunch.com/2016/03/24/microsoft-silences-its-new-a-i-bot-tay-after-twitter-users-teach-it-racism/
[23] Управление ИТ-проектами – 5 вызовов и их преодоление: https://it-guild.com/info/blog/upravlenie-it-proektami-5-vyzovov-i-ikh-preodolenie/
[24] Искусственный интеллект классифицирует запросы в ServiceNow: https://it-guild.com/info/blog/iskusstvennyy-intellekt-dlya-klassifikatsii-zaprosov-v-servicenow/
[25] IT Operations Management: как управлять ИТ-инфраструктурой: https://it-guild.com/info/blog/it-operations-management-upravlenie-it-infrastrukturoy/
[26] Agent Intelligence от ServiceNow — нейронные сети на службе у техподдержки: https://habr.com/ru/company/it-guild/blog/340682/
[27] Знакомство с ITSM: 10 хабратопиков и экспертных материалов для «погружения» в тему: https://habr.com/ru/company/it-guild/blog/453422/
[28] Источник: https://habr.com/ru/post/459030/?utm_source=habrahabr&utm_medium=rss&utm_campaign=459030
Нажмите здесь для печати.