Загадочный чатбот из 60-х, к которому стояли очереди из девушек

В одном из кампусов Массачусетского техинститута в 1966 году стали происходить очень странные дела. У дверей одной из лабораторий начали собираться стайки студенток и лаборанток, которым очень нужно было попасть внутрь хотя бы на 10 минут.

Нет, там не крутили только xnj вышедший битловский “Revolver”. Приманка для прекрасного пола была несколько технологичней: внутри располагался первый в истории созданный человеком чатбот. Его, а вернее её, звали ELIZA и она умела пленять собеседников не хуже античной сирены.

И это пугало ее создателя.

Бабушка ChatGPT

К началу 1960-х Джозеф Вейценбаум (1923 — 2008) был заметной личностью в MIT, но “звездного” статуса пока еще не имел. Сын еврейских эмигрантов, сбежавших от нацистов в Америку, он успел поработать военным метеорологом, а после принял участие в разработке системы ERMA ^[1] для Дженерал Электрик. Это был бухгалтерский суперкомпьютер, ставший прообразом современных ERP.

Джозеф Вейценбаум за работой с, по всей видимости, телетайпом IBM 7094

К тому моменту когда Вейценбаум пришел в МИТ, Марвином Минским была предложена остроумная модель доступа к вычислительным мощностям института: таймшер. То есть несколько юзеров могут коннектиться к компьютеру одновременно, при этом физически будучи в разных местах. Так был дан старт систематической разработке ИИ, а заодно и появился прообраз интернета, на тот момент пилившийся под эгидой ARPA.

Профессор Вейценбаум был заинтригован такой возможностью и приступил к работе над невиданным доселе проектом: компьютер, который мог бы разговаривать с людьми на понятном, человеческом языке. Но как претворить такую алхимию в жизнь?

Четыре “битла” ИИ-революции. У них даже были Шеннон (крайний слева) и Маккарти (рядом с Шенноным). Рядом с Вейценбаумом Эдвард Фредкин, придумавший “вентиль Фредкина”.

За основу для скрипта Вейценбаум берет роджерсовскую терапию ^[2], также известную как “клиенто-центрированная психотерапия” (КЦП). Ее суть заключается в том, что психотерапевт принимает пациента без оценочных суждений и через недирективный метод помогает раскрыть душевные проблемы с помощью участливого слушания и наводящих вопросов.

Но как это все перевести в код?

Код Für ELISE

Итак, технически стесненный Вейценбаум находит выход следующим образом: чтобы программа, нареченная ЭЛИЗой, могла вести “осмысленный диалог”, ее логику нужно поместить меж двух ключевых компонентов:

Поиска ключевых слов (keyword spotting). ЭЛИЗа разбирала фразу пользователя пословно и искала ключевые слова из встроенного вокабуляра: "отец", "мама", "болит", "ненавижу", “грустно”, “весело”. За словами закреплялся ранг важности, поэтому слово “папа” имело высокий ранговый уровень, а нейтральные слова “да/нет” или “возможно” низкий.

Сопоставление шаблонов (pattern matching). После нахождения ключевого слова применялись два этапа преобразования. Первый — разбивка реплики собеседника на части по регулярным шаблонам, с участием ключевого слова в роли лексического якоря и плейсхолдеров для захвата определенных фрагментов. Второй — финальная “сборка” ответа, когда захваченные части подставлялись в шаблон ответа по номеру заранее подготовленного правила.

Далее Вейценбаум вносит модификации в тогдашний ЯП Michigan Algorithmic Decoder (MAD) свой собственный форк, названный MAD-SLIP. Добавленный аппендикс означает симметричный списочный процессор (Symmetric List Processor), который хорошо подходил для составления таких шаблонов.

ЭЛИЗа была развернута на суперкомпьютере IBM 7094 с 36-битной архитектурой и памятью достаточной для 32 тысяч слов. Следуя довольно-таки несложному алгоритму, она произнесла свои первые слова монохромным текстом на сентиментально желтой бумажной ленте телетайпа и было это приблизительно в декабре 1965 — январе 1966 года.

Правда о чем была беседа первого чатбота со своим Пигмалионом история умалчивает. Но мы знаем, что было дальше: в институте началась натуральная ЭЛИЗОмания.

ЭЛИЗа не похожа на современные ЛЛМ, потому что она не умеет учиться и анализировать контекст. Но что в ней было поистине революционно, так это как раз-таки ранжирование слов по важности. Можно сказать, что этот метод в какой-то степени предтеча сегодняшних алгоритмов, понимающих эмоционально-температурную окраску лексики.

Схема работы генеративного, предварительно обученного трансформера (ГПТ) сильно отличается от первого чатбота:

Lend me your ears and I'll sing you a song…

Слухи о том, что в огромном IBMовском шкафу замуровано человеческое сознание быстро облетели университет. Все началось с того, что Вейценбаум протестировал ЭЛИЗу на своей секретарше. По-началу скептически настроенная, минут 20 спустя эта дама попросила профессора оставить ее наедине с ЭЛИЗой, чтобы отвести душу. К вящему неудовольствию профессора.

Вскоре после этого к ней “на прием” стали ломиться студенты — особенно юные студентки — которые хотели побеседовать с чудесной программой обо всем на свете.

Вот пример одного из диалогов, опубликованных в 1966 году:

Загадочный чатбот из 60-х, к которому стояли очереди из девушек - 7

И Вейценбауму происходящее не нравилось. По его словам, его целью было просто создать искусственного собеседника, которому не нужно было бы знать вообще ничего и оперировать исключительно готовыми паттернами для составления ответов. Возможно на эту мысль его натолкнул тест Тьюринга, который Вейценбаум хотел пройти с минимальными ресурсозатратами и показать, что машина может успешно притвориться человеком.

ЭЛИЗомания приобретала нездоровый характер в его глазах: “Подумай ещё на десять минут дольше и я бы просто изобрел барменов”, впоследствии скажет он в интервью 20 лет спустя. И хотя его изобретение высоко ценили коллеги — например Карл Саган был в восторге от идеи развернуть мобильные пункты экстренной психотерапии наподобие телефонных будок с ЭЛИЗой внутри — Вейценбаум был категорически против.

Телетайп-лента с jhbubyfkmysv диалогом с ЭЛИЗой

«Есть определенные задачи, которые компьютеры не должны выполнять, независимо от того, можно ли заставить их делать это или нет», — напишет он в 1976 году в своей книге «Вычислительная мощность и человеческий разум».

Вейценбаум считал, что люди попадают в иллюзорный плен к компьютеру, потому что чувствуют ложный эмпатический отклик от машины, дополнительно усиленный мгновенным фидбэком. Но это ощущение все равно иллюзия, так как действия машины целиком и полностью зависят от человеческого инпута — иными словами, это разговор с собственным эхо. Такой сюжет однажды был в греческой мифологии и мы знаем, что он печально закончился.

ЭЛИЗа, не исчезай…

Программа была названа по имени Элизы Дулиттл из “Моей прекрасной леди” (по мотивам пьесы Бернарда Шоу). По сюжету ее тоже учат говорить “по-человечески”.

К сожалению, Вейценбаум не застал появление БЯМ. Но, вероятно, он понимал, что его работа опережала свое время на годы вперед, так как он успел осознать какие опасности очеловеченная говорящая коробка таит в себе. И не только осознал, но и предупредил нас.

А ЭЛИЗа по-прежнему доступна вот здесь ^[3] и на Гитхабе ^[4]. Ее можно запустить прямо в браузере и поговорить с эхом патлатых 60-х, когда даже такой простой скрипт казался абсолютным волшебством.

Автор: DimaIam

Источник ^[5]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/ii/450309

Ссылки в тексте:

[1] ERMA: https://en.wikipedia.org/wiki/Electronic_Recording_Machine,_Accounting

[2] роджерсовскую терапию: https://www.imaton.ru/vebinar/klient-centrirovannaya-cheloveko-centrirovannaya-psihoterapiya-osnovy-i-evolyuciya-podhoda-karla-rodzhersa/

[3] вот здесь: https://www.masswerk.at/elizabot/eliza_test.html

[4] на Гитхабе: https://github.com/codeanticode/chatbots-library/blob/master/src/codeanticode/chatbots/eliza/Eliza.java

[5] Источник: https://habr.com/ru/articles/1027292/?utm_campaign=1027292&utm_source=habrahabr&utm_medium=rss

Нажмите здесь для печати.