- PVSM.RU - https://www.pvsm.ru -

Поговори со мной: что сегодня умеют голосовые боты

Поговори со мной: что сегодня умеют голосовые боты - 1

18 лет назад в аниме-сериале «Призрак в доспехах: Синдром одиночки» показали совершенно фантастических роботов-операторов. Помимо очень продвинутых физических возможностей [1] (вам бы с такими пальцами код набирать!), они прекрасно умели общаться с людьми голосом. Сегодня ботами уже никого не удивишь. Мы встречаемся с ними повсеместно, в различных сферах нашей жизни. Они используются в медицинских учреждениях, банках, в продажах, в обслуживании клиентов, в социальных сетях и т.д. И если к чат-ботам мы уже начинаем привыкать, то голосовые боты для многих ещё в новинку. Да и сами технологии ещё далеки от совершенства. Какая сейчас ситуация с голосовыми ботами?

Началась история голосовых ботов с чат-ботов в далеком 1966 году. Первая подобная разработка была создана Джозефом Вайценбаумом и называлась «Элиза». Бот вёл диалог как психотерапевт, переспрашивал фразы и требовал их продолжить. Многие при первом общении не понимали, что общаются с машиной. Фразы строились по типу:

— У меня болит голова.
— Отчего у вас болит голова?

Фактически, «Элиза» являлась пародией на психотерапевта и никаких функций не выполняла. Но, всё-таки, это был первый чат-бот.

Следующий бот появился в 1972 году и носил имя «Parry». Он играл роль больного шизофренией и сумел обмануть многих врачей, которые с ним общались.

Значимой вехой в развитии ботов стал A.L.I.C.E. (Artificial Linguistic Internet Computer Entity). Это был первый бот, который мог вести практически полноценный диалог с человеком, используя эвристический анализ для сопоставления полученных фраз с имеющимися в базе. Ответы были довольно общими, но даже такое общение для 1995 года было прорывом. С тех пор алгоритмы взаимодействия ботов с пользователями совершенствуются каждый год семимильными шагами. С появлением нейронных сетей боты стали в разы умнее. При общении с разными людьми боты с помощью машинного обучения пополняют свою базу данных и учатся говорить как человек.

С развитием технологий распознавания речи и синтеза голоса появились голосовые боты. Это следующий шаг к полноценному виртуальному помощнику, который сможет решать всевозможные простые задачи без участия человека. Сфер использования таких помощников множество: замена операторов колл-центра на первичном этапе обработки заявок; техническая поддержка в простых и наиболее распространенных вопросах; автоматизация продаж и заказа товаров; оповещение клиентов и проведение опросов; электронные секретари-референты, которые не устают и ничего не забывают; интеллектуальные автоответчики и т.д. Постепенно голосовые боты заменяют собой целые колл-центры и обрабатывают все входящие звонки от клиентов. И если бот не может решить вопрос, с которым обратился клиент, он переключает звонок на человека-оператора.

Также голосовыми ботами начинают оснащать разные «умные» приборы. Благодаря развитию IoT, виртуальные помощники всё чаще появляются в нашей жизни. Например, в 2018 году умные колонки были у каждого шестого совершеннолетнего американца [2]. Это устройство с интегрированным голосовым ботом, которое подключается к интернету по любому доступному интерфейсу и может проигрывать музыку с потоковых сервисов, заказать доставку или такси, зачитать почту, найти информацию по какому-то запросу, рассказать ребенку сказку, озвучить погоду и многое другое. Рост продаж этих гаджетов в 2017 году составлял 128 % [3]. В России зарубежные устройства, не говорящие на русском языке, распространения не получили, но в с недавних пор на рынке появились и отечественные разработки. Они обладают тем же набором возможностей, что и зарубежные аналоги, а в некоторых областях и превосходят их.

В скором времени мы тоже выпустим свою умную колонку «Капсулу» (сейчас открыт предзаказ [4]). Она появилась на свет немного позже, чем аналогичные устройства. Единственная кнопка на колонке отключает все 6 микрофонов, остальное управление осуществляется голосом или с помощью тактильного сенсора на макушке. Первое подключение достаточно простое — необходимо скачать на смартфон приложение «Маруся» и подключить колонку через него к Wi-Fi. Авторизация в ВК позволяет слушать музыку из своего плейлиста и звонить друзьям: «Капсула» — первая умная колонка на российском рынке, которая умеет звонить по сети. Или можете слушать свою собственную подборку музыки на смартфоне через Bluetooth. А ещё колонку можно использовать как калькулятор: попросите её что-нибудь сложить или умножить, и она сразу скажет результат.

Её возможности постоянно расширяются. Например, недавно добавили «звуки офиса»: сидишь себе дома на удалёнке, и чтобы перемены не были так болезненны, включаешь себе привычный офисный шум. Также мы уже научили «Капсулу» играть в игры: викторины, «Города», «Ерундопель», «Верю — не верю», «Фанты» и другие. А в недалеком будущем планируем научить её развлекать детей: издавать голоса различных животных и интересные звуки, играть в развивающие игры с помощью RFID-карточек и т.д. Сейчас Маруся умеет вести диалоги и отвечать на вопросы, но уже скоро появится возможность заказать такси, еду, билеты в кино и т.д.

В скором будущем голосовые помощники смогут выполнять задачи референта. Например, существует версия голосового ассистента Google Duplex. Пока ей могут воспользоваться только обладатели смартфонов Pixel в некоторых города США, но планируется внедрение в iOS и Android. Презентация бота состоялась в 2018-м на конференции Google I/O [5]. Бот позвонил в ресторан и забронировал столик, общаясь голосом, неотличимым от человеческого. В недалеком будущем планируется значительное расширение возможностей Duplex. Он сможет совершать звонки от имени пользователя, вызывать ремонтные службы, договариваться о встречах и многое другое. При этом человек на другом конце провода будет оповещен о том, что общается с ботом от имени хозяина.

Всё более популярными становятся и колл-центры на основе голосовых ботов. Так, на основе того же Duplex, компания Google представила интеллектуальную голосовую систему Google Contact Center AI. Искусственный интеллект сможет принимать все входящие звонки, обрабатывать их и принимать решение о необходимости подключения специалиста для решения задачи. Помимо Google, голосовые помощники разрабатываются множеством компаний, в том числе KVINT, Robovoice, Glagol и т.д.

Боты в качестве операторов колл-центров могут использоваться как для исходящих вызовов (информирование клиентов, опросы, маркетинговые исследования согласования, уточнения по заказам и многое другое), так и для обработки входящих звонков от клиентов, решения простых задач, описанных в базе данных. В случае необходимости бот переключает звонок на оператора соответствующего департамента: продаж, обслуживания, технической поддержки и т.д.

Голосовые боты могут помочь, когда требуется совершать или принимать тысячи типовых звонков в день. Один робот заменяет десятки операторов в режиме 24/7. Естественно, что полностью заменить человека пока что не получится: есть множество ситуаций, с которыми робот не справится. Но он хотя бы может существенно снизить нагрузку на операторов колл-центра.

К примеру, некоторые российские банки уже пользуются голосовыми ботами (1 [6], 2 [7], 3 [8], 4 [9]). Робот может подсказать баланс, адрес ближайшего банкомата, курс валюты и т.д. Например, голосовой помощник ВТБ успешно обрабатывает около 25 % обращений клиентов. Робот отвечает на вопрос в течение нескольких секунд и это не зависит от времени суток и количества свободных операторов. Когда клиент изложит суть вопроса, бот автоматически перенаправит его на соответствующий сервис. Звонок переводится на оператора только в том случае, если ответа на вопрос клиента нет в базе данных. Система основана на нейронной сети и самообучается. С момента внедрения голосового бота, уровень распознавания речи клиентов банка вырос до 85 %. Робот автоматически собирает и структурирует информацию по запросам пользователей. Благодаря этим данным ВТБ улучшил некоторые сервисы и запустил новые (СМС-информирование о дате готовности карты, об адресах отделений и т.д.). Бот существенно сокращает нагрузку на сотрудников колл-центра банка, а также экономит время специалистов.

Есть у голосовых ботов и недостатки. Хотя технологии позволяют распознавать большинство фраз людей, но когда вопрос отличается от типового, многие роботы начинают водить пользователя по простым вопросам кругами, пытаясь найти решение проблемы без привлечения специалиста. Это сильно раздражает клиентов и вызывает недовольство. Также бот может ошибочно распознать вопрос и выдать неправильный ответ, что также отнимает у клиентов время и нервы.

Над исправлениями этих и других недостатков сейчас ведется активная работа. Совершенствуются базы данных и технологии машинного обучения, развиваются методики синтеза и распознавания речи. Уже сейчас тестируются голосовые боты следующих поколений. Например, в ВТБ проходит обкатку бот для исходящих звонков, который может предложить банковские продукты, рассказать об условиях их использования и ответить на возражения клиента.

Сегодня немало стартапов разрабатывают решения в сфере голосовых ботов. Из интересных можно упомянуть такие:

ELLIQ от Intuition Robotics [10]. Это голосовой ассистент, разработанный для пожилых людей. Он облегчает им погружение в цифровой мир и общение с интернетом вещей. ELLIQ расскажет о том, как пользоваться чатами, мессенджерами, социальными сетями, уведомит, если пришло новое сообщение от друзей или семьи или поступил звонок от кого-либо, либо предложит сам позвонить родным, если они появились в сети. Помощник может подобрать плейлист, заказать лекарство или продукты, озвучит погоду на ближайшие дни, напомнит о необходимости приема лекарств и т.д. ELLIQ поможет разобрать в мире цифровых технологий даже очень слабо разбирающимся в этом людям.

Chris от German Autolabs [11]. Это голосовой помощник для водителей. Он позволяет подключать необходимые водителю приложения, совершать звонки и отвечать на них с помощью голосовых команд и простых жестов. Также с его помощью можно включать музыку, переключаться между треками и радиостанциями. Chris может подсказать дорогу, найти оптимальный маршрут и укажет, как сэкономить время, объехав пробки.

Ada Health [12]. Специализированный медицинский помощник, разработанный группой врачей и ученых для помощи в заботе о нашем здоровье. На текущий момент помощник представляет из себя чат-бота в виде отдельного мобильного приложения, но в недалекой перспективе планируется внедрение голосового режима. Бот помогает по введенным симптомам и описанию проблем со здоровьем поставить диагноз и подобрать лечение. Стартап сотрудничает с ведущими компаниями в области здравоохранения и опирается на их опыт. С момента запуска проекта в 2016 году приложение распространилось в 140 странах и имеет 15 млн оценок.

Dasha.ai [13]. Универсальная система, предлагающая аутсорсинговые услуги по обзвону и ответам на звонки. «Даша» умеет звонить клиентам, продавать товары, отправлять письма по результатам разговора, общаться в чате и отвечать на вопросы. Конечно, для работы ей требуется детально прописанный скрипт. «Даша» понимает выражения-синонимы, запоминает слова и контекст, используемые собеседником; распознаёт, когда её перебивают или просят перезвонить. Человек слышит по телефону нормальную «человеческую» речь, и многие даже не понимают, что общаются с роботом:

https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_1_mp3.mp3 [14]

https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_2_mp3.mp3 [15]

* * *

В будущем голосовые боты полностью заменят многочисленные колл-центры и будут решать большинство запросов клиентов, позволяя свести работу специалистов к минимуму. Также развиваются и электронные помощники, выходя за пределы привычных гаджетов. Они поселятся во всех бытовых приборах, автомобилях и даже в одежде. Вместо многочисленных помощников на разных устройствах, будет один ассистент для каждого пользователя.

Автор: Barrayar

Источник [16]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/iskusstvenny-j-intellekt/350132

Ссылки в тексте:

[1] физических возможностей: http://i.imgur.com/gCJ5pBA.gif

[2] умные колонки были у каждого шестого совершеннолетнего американца: https://techcrunch.com/2018/01/12/39-million-americans-now-own-a-smart-speaker-report-claims/

[3] составлял 128 %: https://www.billboard.com/articles/business/8085524/smart-speaker-sales-tripled-25-million-year-2017

[4] предзаказ: https://capsula.mail.ru/

[5] состоялась в 2018-м на конференции Google I/O: https://www.youtube.com/watch?v=D5VN56jQMWM

[6] 1: https://www.forbes.ru/finansy-i-investicii/377763-tinkoff-zapustil-golosovogo-pomoshchnika-so-vspylchivym-harakterom

[7] 2: https://www.homecredit.ru/about/bank_news/maria-16-01-2020/

[8] 3: https://www.rbc.ru/rbcfreenews/5a93c5c09a7947207b3831e2

[9] 4: https://alfabank.ru/press/news/2018/9/20/47944.html

[10] ELLIQ от Intuition Robotics: https://elliq.com/

[11] Chris от German Autolabs: https://www.germanautolabs.com/chris

[12] Ada Health: https://ada.com/about/

[13] Dasha.ai: https://dasha.ai/ru/

[14] https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_1_mp3.mp3: https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_1_mp3.mp3

[15] https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_2_mp3.mp3: https://dasha.ai/ru/wp-content/uploads/2019/09/dasha_demo_2_mp3.mp3

[16] Источник: https://habr.com/ru/post/493138/?utm_source=habrahabr&utm_medium=rss&utm_campaign=493138