- PVSM.RU - https://www.pvsm.ru -

В одном из кампусов Массачусетского техинститута в 1966 году стали происходить очень странные дела. У дверей одной из лабораторий начали собираться стайки студенток и лаборанток, которым очень нужно было попасть внутрь хотя бы на 10 минут.
Нет, там не крутили только xnj вышедший битловский “Revolver”. Приманка для прекрасного пола была несколько технологичней: внутри располагался первый в истории созданный человеком чатбот. Его, а вернее её, звали ELIZA и она умела пленять собеседников не хуже античной сирены.
И это пугало ее создателя.
К началу 1960-х Джозеф Вейценбаум (1923 — 2008) был заметной личностью в MIT, но “звездного” статуса пока еще не имел. Сын еврейских эмигрантов, сбежавших от нацистов в Америку, он успел поработать военным метеорологом, а после принял участие в разработке системы ERMA [1] для Дженерал Электрик. Это был бухгалтерский суперкомпьютер, ставший прообразом современных ERP.
К тому моменту когда Вейценбаум пришел в МИТ, Марвином Минским была предложена остроумная модель доступа к вычислительным мощностям института: таймшер. То есть несколько юзеров могут коннектиться к компьютеру одновременно, при этом физически будучи в разных местах. Так был дан старт систематической разработке ИИ, а заодно и появился прообраз интернета, на тот момент пилившийся под эгидой ARPA.
Профессор Вейценбаум был заинтригован такой возможностью и приступил к работе над невиданным доселе проектом: компьютер, который мог бы разговаривать с людьми на понятном, человеческом языке. Но как претворить такую алхимию в жизнь?
За основу для скрипта Вейценбаум берет роджерсовскую терапию [2], также известную как “клиенто-центрированная психотерапия” (КЦП). Ее суть заключается в том, что психотерапевт принимает пациента без оценочных суждений и через недирективный метод помогает раскрыть душевные проблемы с помощью участливого слушания и наводящих вопросов.
Но как это все перевести в код?
Итак, технически стесненный Вейценбаум находит выход следующим образом: чтобы программа, нареченная ЭЛИЗой, могла вести “осмысленный диалог”, ее логику нужно поместить меж двух ключевых компонентов:
Поиска ключевых слов (keyword spotting). ЭЛИЗа разбирала фразу пользователя пословно и искала ключевые слова из встроенного вокабуляра: "отец", "мама", "болит", "ненавижу", “грустно”, “весело”. За словами закреплялся ранг важности, поэтому слово “папа” имело высокий ранговый уровень, а нейтральные слова “да/нет” или “возможно” низкий.
Сопоставление шаблонов (pattern matching). После нахождения ключевого слова применялись два этапа преобразования. Первый — разбивка реплики собеседника на части по регулярным шаблонам, с участием ключевого слова в роли лексического якоря и плейсхолдеров для захвата определенных фрагментов. Второй — финальная “сборка” ответа, когда захваченные части подставлялись в шаблон ответа по номеру заранее подготовленного правила.
Далее Вейценбаум вносит модификации в тогдашний ЯП Michigan Algorithmic Decoder (MAD) свой собственный форк, названный MAD-SLIP. Добавленный аппендикс означает симметричный списочный процессор (Symmetric List Processor), который хорошо подходил для составления таких шаблонов.
ЭЛИЗа была развернута на суперкомпьютере IBM 7094 с 36-битной архитектурой и памятью достаточной для 32 тысяч слов. Следуя довольно-таки несложному алгоритму, она произнесла свои первые слова монохромным текстом на сентиментально желтой бумажной ленте телетайпа и было это приблизительно в декабре 1965 — январе 1966 года.
Правда о чем была беседа первого чатбота со своим Пигмалионом история умалчивает. Но мы знаем, что было дальше: в институте началась натуральная ЭЛИЗОмания.
ЭЛИЗа не похожа на современные ЛЛМ, потому что она не умеет учиться и анализировать контекст. Но что в ней было поистине революционно, так это как раз-таки ранжирование слов по важности. Можно сказать, что этот метод в какой-то степени предтеча сегодняшних алгоритмов, понимающих эмоционально-температурную окраску лексики.
Слухи о том, что в огромном IBMовском шкафу замуровано человеческое сознание быстро облетели университет. Все началось с того, что Вейценбаум протестировал ЭЛИЗу на своей секретарше. По-началу скептически настроенная, минут 20 спустя эта дама попросила профессора оставить ее наедине с ЭЛИЗой, чтобы отвести душу. К вящему неудовольствию профессора.
Вскоре после этого к ней “на прием” стали ломиться студенты — особенно юные студентки — которые хотели побеседовать с чудесной программой обо всем на свете.
Вот пример одного из диалогов, опубликованных в 1966 году:

И Вейценбауму происходящее не нравилось. По его словам, его целью было просто создать искусственного собеседника, которому не нужно было бы знать вообще ничего и оперировать исключительно готовыми паттернами для составления ответов. Возможно на эту мысль его натолкнул тест Тьюринга, который Вейценбаум хотел пройти с минимальными ресурсозатратами и показать, что машина может успешно притвориться человеком.
ЭЛИЗомания приобретала нездоровый характер в его глазах: “Подумай ещё на десять минут дольше и я бы просто изобрел барменов”, впоследствии скажет он в интервью 20 лет спустя. И хотя его изобретение высоко ценили коллеги — например Карл Саган был в восторге от идеи развернуть мобильные пункты экстренной психотерапии наподобие телефонных будок с ЭЛИЗой внутри — Вейценбаум был категорически против.
«Есть определенные задачи, которые компьютеры не должны выполнять, независимо от того, можно ли заставить их делать это или нет», — напишет он в 1976 году в своей книге «Вычислительная мощность и человеческий разум».
Вейценбаум считал, что люди попадают в иллюзорный плен к компьютеру, потому что чувствуют ложный эмпатический отклик от машины, дополнительно усиленный мгновенным фидбэком. Но это ощущение все равно иллюзия, так как действия машины целиком и полностью зависят от человеческого инпута — иными словами, это разговор с собственным эхо. Такой сюжет однажды был в греческой мифологии и мы знаем, что он печально закончился.
К сожалению, Вейценбаум не застал появление БЯМ. Но, вероятно, он понимал, что его работа опережала свое время на годы вперед, так как он успел осознать какие опасности очеловеченная говорящая коробка таит в себе. И не только осознал, но и предупредил нас.
А ЭЛИЗа по-прежнему доступна вот здесь [3] и на Гитхабе [4]. Ее можно запустить прямо в браузере и поговорить с эхом патлатых 60-х, когда даже такой простой скрипт казался абсолютным волшебством.
Автор: DimaIam
Источник [5]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/ii/450309
Ссылки в тексте:
[1] ERMA: https://en.wikipedia.org/wiki/Electronic_Recording_Machine,_Accounting
[2] роджерсовскую терапию: https://www.imaton.ru/vebinar/klient-centrirovannaya-cheloveko-centrirovannaya-psihoterapiya-osnovy-i-evolyuciya-podhoda-karla-rodzhersa/
[3] вот здесь: https://www.masswerk.at/elizabot/eliza_test.html
[4] на Гитхабе: https://github.com/codeanticode/chatbots-library/blob/master/src/codeanticode/chatbots/eliza/Eliza.java
[5] Источник: https://habr.com/ru/articles/1027292/?utm_campaign=1027292&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.