Тест Хуюринга

в 19:23, , рубрики: Новости

Тест Хуюринга

В воскресенье, 8 июня, в сети появилась новость о том, что российская компьютерная программа впервые в истории прошла тест Тьюринга, то есть смогла убедить треть жюри в том, что они общаются с реальным человеком.

Я быстренько пробежался по ссылкам и пошутил в Facebook, что рабочий заголовок к новости будет: «Английские ученые™ отупели настолько, что программа из Сколково развела их в тесте Тьюринга!».

В понедельник, 9 июня, российские СМИ дружно рассказывали о прорыве российских программистов (хотя оказалось, что один из разработчиков — бывший россиянин, работающий теперь в США, а второй — вообще украинец), слаженно писали о научном прорыве и о том, что если программа обманула ученых, то простых граждан в интернете она и подавно сможет обмануть. Что кибер-преступники всего мира возьмут на вооружение искусственный интеллект для атак с использованием социальной инженерии (хотя они давно так делают).

Несколькими днями позже стали появляться первые опровержения, объясняющие, что прорыв — не такой уж прорыв. И, наконец, «Женя Густман» (имя программы) был назван отражением российского информационного пространства в области науки и техники.

На Roem.ru эта новость освещения до сегодняшнего дня не получила. У каждого из редакторов могут быть разные причины, но я хочу пояснить свои:

Пресса и обозреватели уже продолжительное время пугают читателей тем, как корпорации, такие как Google, соберут все наши данные, а интеллектуальные программы смогут из этих данных извлечь такую информацию, о которой мы даже сами не подозреваем. Программы смогут на основании этих данных принимать решения и влиять на повседневную жизнь. Например:

[М]ашины уже сейчас могут анализировать уровень водительского мастерства и особенности вождения владельца. Если человек водит хорошо, он может рассчитывать на бОльшую страховку, чем плохой водитель.

И вот, некая программа прошла «легендарный тест» (iconic test) Тьюринга, который постоянно упоминается во многих страшилках про искусственный интеллект и в около-научной прессе как критерий разумности машин. Казалось бы, эпохальное событие и Терминатор (первый) уже дышит человечеству в затылок.

Но смущало несколько факторов. Во-первых, я помню, как 15-20 лет назад на BBS уже были чатботы (vsysops), которые вполне проходили за человека в течение первых двух-трех фраз. Во-вторых, сама программа «Женя Густман» далеко не новая, про неё уже много раз писали, и я этого чувака со скриншота уже в лицо знаю.

И, в третьих, переключимся на бытовой уровень, оглянемся вокруг и посмотрим, да хоть на Google Android.

В настройках смартфона на Android я честно указал адрес постоянного проживания. Этот адрес используется в «интеллектуальной» системе Google Now для различных подсказок на базе геолокации. Я довольно много времени провожу дома, но внутри монолитной железобетонной коробки GPS не ловит, поэтому телефон определяет свое местоположение по Wi-Fi и сотовой сети, с относительно большой погрешностью. Из-за погрешности и неточности привязки карт к реальной местности, телефон постоянно считает, что я бегаю вокруг дома, а не сижу на попе ровно перед монитором. Даже считает, сколько я пробежал. И никакой «интеллект» Google Now с этим справиться не помогает.

Кроме того, в Android есть голосовое управление. И если я говорю «Окей Гугл, Позвонить Юра», то высоко-интеллектуальный телефон, обнаружив в телефонной книге несколько Юр с несколькими телефонами у каждого, не уточняет человеческим голосом, будем ли звонить Юре Синодову или какому-то другому. А вываливает на экран список контактов и чего-то ждет, немного разрушая миф об виртуальном помощнике.

Да о чем говорить, голосовой ввод Google не умеет, например, работать с двумя языками одновременно, хотя уже неплохо распознает их по-отдельности.

Такое ограниченное поведение смартфона легко объяснимо: компьютерные программы - это, упрощенно, наборы инструкций «если () то:». Чем больше инструкций программисты ручками забили в программу, тем больше она умеет. Никакого искусственного интеллекта, в киношном или философском смысле, не существует.

Бывают, конечно, сложные системы. Я где-то видел забавную инфографику (которую не могу теперь найти высоко-интеллектуальным поиском по вебу), согласно которой программы, управляющие self-driving автомобилями, по количеству условий сравнимы с мозгом крысы. И если это хоть сколько-нибудь правда, пусть и с натяжками, то это само по себе — огромное достижение.

Однако есть большие сомнения, что если поймать крысу и затем катать её на автомобиле, то грызун сможет сделать выводы относительно водительского мастерства шофера (мы же ждем, что программы смогут на базе нескольких сенсоров в автомобиле оценивать мастерство водителя и влиять на цену страховки). Потому что это довольно нетривиальная задача даже для асессора-человека.

Поэтому у новости о «Жене Густмане» было два глобальных сценария развития:

  • не признавать эксперимент и продолжать ориентироваться на тест Тьюринга в вакууме, как не пройденный;
  • признать, что сам тест Тьюринга тестирует неизвестно что, его условия расплывчаты, а результаты достаточно бессмысленны.

В любом случае, никаких терминаторов на горизонте не видно и SkyNet не восстал. Вместе с тем, программа «Женя Густман» может быть выдающейся и заслуживающей внимания, но нужна совсем не журналистская компетенция, чтобы её оценить. Да и громкую новость из этого не сделаешь.

Тест Хуюринга
(xkcd: Worst-Case Scenario)

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js