- PVSM.RU - https://www.pvsm.ru -
Разработчики суперкомпьютера IBM Watson сделали большую ошибку, когда закачали в его память словарь уличного жаргона с сайта Urban Dictionary [1]. IBM Watson обучен распознавать смысл предложений/вопросов и отвечать на них, используя усвоенные массивы неструктурированных данных (data mining). Благодаря этому компьютер выиграл у чемпионов телевикторины «Своя игра» [2] (Jeopardy) в 2011 году, после чего начал изучать медицинские справочники [3] с целью диагностировать болезни по симптоматике, как доктор Хаус.
Разработчики думали, что информация о дополнительных смыслах слов улучшит искусственный интеллект, поможет ему лучше понимать людей. Они ошиблись. Уличный жаргон оказался исключительно вреден суперкомпьютеру. Однажды он даже ответил на вопрос неприличным словом “Bullshit”.
В результате, разработчики приняли решение очистить память IBM Watson от сленга и поставить фильтр на выдаваемые слова, чтобы не допустить случайно ненормативной лексики в прямом эфире.
Ответственность на себя взял один из сотрудников проекта Эрик Браун (Eric Brown). На фотографии он изображён внутри кластера IBM Watson. Кстати, команда разработчиков IBM Watson состоит из 35-ти человек.
В интервью CNNMoney [4] Эрик Браун рассказывает, что проблема возникла с тем, что компьютер не мог определить, какой смысл слова является приличным, а какой — нет. Из-за этого он иногда использовал слова в неприличном смысле.
Эрик Браун говорит, что некоторые плохие привычки у IBM Watson появились также после чтения Википедии. Вот почему удаления Urban Dictionary оказалось недостаточно, а пришлось ставить дополнительный словарный фильтр. В будущей работе IBM Watson как врача-диагноста лексика вроде OMG или LOL вовсе неуместна.
Автор: alizar
Источник [5]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/24530
Ссылки в тексте:
[1] Urban Dictionary: http://www.urbandictionary.com/
[2] выиграл у чемпионов телевикторины «Своя игра»: http://habrahabr.ru/post/110028/
[3] начал изучать медицинские справочники: http://habrahabr.ru/company/ibm/blog/120103/
[4] интервью CNNMoney: http://tech.fortune.cnn.com/2013/01/07/ibm-watson-slang/
[5] Источник: http://habrahabr.ru/post/165423/
Нажмите здесь для печати.