Сравнение Google Home и Amazon Alexa

в 9:04, , рубрики: amazon, Google, IoT, голосовое управление, распознавание речи, умный дом

Недавно мне в руки попало два популярных голосовых помощника. В этом обзоре я расскажу о том, что они умеют и чего пока не умеют.

image

Покупка и инсталляция

Google Home сейчас стоит $129, цена Amazon Echo с помощником Alexa $179. Оба, конечно, не продаются в России. Что ж, едем в США и покупаем там.

Google Home предлагается в 7-ми разных цветах тряпичного чехла, закрывающего нижнюю часть устройства (там находится колонка). Алекса бывает черная и белая и по размеру существенно крупнее и увесистее конкурента. Оба сделаны из приятного матового пластика. На мой личный взгляд внешне Google Home кажется каким-то обрубком, тогда как нижняя часть Alexa похожа на дуршлаг. Но о вкусах не спорят.

Зато надо отметить, у Google Home отличная коробка, ее хочется открывать и закрывать снова и снова. Продакт дизайнеры очень постарались.

image

В качестве внешних интерфейсов у Алексы 2 кнопки, а у Гугла небольшой невидимый тачскрин, по которому у меня редко получается попасть. Впрочем, эти кнопки и не нужны, ведь всеми функциями можно управлять голосом.

Для подключения нужно скачать приложение (приложение Alexa пришлось ставить как apk, его нет в российском сторе), и настроить доступ в домашний Wi-Fi. Делается это довольно просто, только нужно не забыть также включить bluetooth на телефоне. После подключения в домашний Wi-Fi устройства быстро линкуются с приложением — и вы можете видеть, как их движки интерпретируют полученные фразы.

Немного о безопасности. Как известно, "the S in IoT stands for Security". Помощники слинкованы с вашим личным аккаунтом, но не распознают голос хозяина. Кто угодно может воспользоваться ими, чтобы прочитать вашу почту и что еще там вы им доверили.

Распознавание речи

Распознавание паттерна вызова ("OK, Google" и "Alexa") происходит на месте, а распознавание фразы и формирование ответа — в облаке. Это, кстати, их принципиальное отличие от Siri, которая работает оффлайн. У меня ни разу не случалось, чтобы помощники не узнали свое имя. Зато не раз бывало, чтобы в качестве имени приняли что-то еще.

Наш с супругой среднерусский английский Google понимает очень хорошо. Практически все простые фразы распознаются корректно с первой попытки, чего не скажешь об Алексе.

— Alexa, what’s under rubber new riddle?
— Alexa, what is them to bring new rail?
— Alexa, what is an tripper no real?

Ок, слово сложное, спрошу покороче

— Alexa, what is interpret priner?
— Alexa, what is an trump renewal?
— Alexa, what is an to pandora?

Зайдем с другой стороны

— Alexa, what is a synonym for businessman?
— Business’s synonyms include business executive and business person.

Ну хорошо, дорогая. Кому интересно, изначальное слово было entrepreneurial.

Ведем непринужденную беседу

Оба помощника имеют встроенный обширный набор предустановленных фраз и ответов. Не с кем поговорить о любви, о жизни? Роботы к вашим услугам. Например, обоих можно попросить 'tell me a joke'. Набор шуток у них обширный, но ни одна из шуток не показалась мне смешной. Думаю, коварные нейросети просто притворяются тупее, чем они есть.

— Alexa, who killed Kenny?
— Oh my god, they killed Kenny!

— OK, Google, are you robot?
— I prefer to think of myself as your friend

— Alexa, what is the purpose of life?
— The answer is 42, but the question is far more complicated

— OK, Google, what is your gender?
— I am all inclusive

— Alexa, does Santa exist?
— I don’t know him personally, but I heard a lot of good things about Santa

— OK, Google, tell me a story
— One there lived a protagonist and some supporting characters. Together they went on a journey. And twist ending, it was all a dream!

— Alexa, am I funny
— I don’t have a sense of humour so it’s hard for me to tell

И здесь она определенно не соврала.

Поиск

Alexa отправляет вопросы в bing, а куда их отправляет Google Home – догадаться несложно. Оба помощника вполне сносно пользуются интернет поиском и Википедией в ответ на вопросы. На мой взгляд, Гугл ищет лучше – он гибче настроен на поисковые фразы и чаще понимает, что запрос поисковый.

— Alexa, when Moscow was founded?
— Moscow state of establishment was 1147

— OK, Google, what is a greatest number
— According to English Language and Usage, 7 is the smallest and 9 is the greatest number

— Alexa, where is Kilkenny?
— Kilkenny is a city in Kilkenny, Ireland (...)

— OK, Google, which fish is the fastest?
— Sailfish. According to china.org.cn the sailfish is the fastest fish in the world able to speed at a swim speed of 68 miles per hour

Так что, Борис Борисыч, развейте наконец свои сомнения, ИИ нам все рассказал.

Фичи out-of the-box

Оба умеют рассказывать, что стоит у вас в Гугл-календаре (но озвучивают только латинское написание). Почту пока не читают. И слава роботам, см выше про безопасность.
Гугл умеет переводить на множество языков, Алекса – нет

— OK, Google, what is ‘Mother washed a frame’ in Russian?
— Мать мыл раму

Оба умеют стримить музыку из популярных приложений (платите деньги), а также радио и новости (бесплатно). Насчет музыки надо понимать, что так как данные на железку идут через Cloud, то стримить ее с телефона затруднительно, такой опции нет. Amazon и Google разрешают бесплатно загрузить на ваш аккаунт в их музыкальных сервисах какое-то количество треков и играть их оттуда.

Alexa позволяет делать покупки на Amazon. Для покупок можно установить pin-код, чтобы соседи не игрались.

— Alexa, shopping
— Would you like to shop?
— Yes
— What would you like to order?
— Books
— Voice ordering is exclusively available for prime members. Would you like me to add Books to Nikolai’s cart instead?
— Yes

Здесь в приложении появляется набор книг, можно продолжить покупки там.

Помимо этого, у обоих есть довольно много толковых и не очень фич, таких как игра в викторину, будильник, калькулятор, конвертер мер и валют, толковый словарь и так далее.

Фичи с бубном

8 декабря было объявлено о запуске открытого API для Google Home. Говорится, что механизм под названием Google Actions заработает в начале 2017 года и позволит третьим сторонам создавать диалоговые сценарии, через которых пользователь сможет использовать обращаться к контенту или сервисам поставщика. Мудрено написал, в общем смотрите, как это работает в Alexa Skill Kit, который существует с середины 2015.

В приложении Alexa есть магазин skills, разработанных разными сервисами, такими как Expedia или NASA. Скилл — это доступ к услугам/информации сервиса посредством голосовых команд. Его можно бесплатно подключить в магазине или просто голосом, назвав ключевое слово или фразу.

— Alexa, ask NASA Mars to get me a Curiosity rover update

— Alexa, ask RecipeFinder what I can cook with tuna and cheese
— Here are some more recipes (..) I have included links to the recipes in your cart

Ссылки появляются в приложении. Не кликабельные арррргх!

В скиллах круто то, что они представляют собой диалог, который может иметь достаточно много опций развития (в отличие от сценариев IFTTT, о которых речь дальше). Пока что количество оценок у скиллов в магазине Alexa измеряется сотнями, так что это только первые шаги в создании голосовых интерфейсов. Свои скиллы запустили Expedia и Kayak, но они не дают возможности голосом бронировать билеты и отели, можно только цены смотреть. Тем не менее, можно бронировать автомобиль в Expedia, заказывать Uber, и есть даже один банковский скилл, который позволяет оплачивать счета.

Кроме того, у Alexa и Google имеется свой IFTTT канал, через который можно настроить еще больше функций. IFTTT позволяет делать между сервисами триггеры вида «если сервис 1 сказал А, то отправить в сервис 2 команду Б». Такой канал имеют почти все Smart Home железяки, несколько крупных торговых сетей (они позволяют только обновлять онлайн-корзину) и миллион информационных порталов. Беда с IFTTT в том, что все рецепты для Алексы и Гугла позволяют делать что-то по голосовой команде (заметки в spreadsheet, пост в фейсбуке, включить термостат), но не позволяют прокидывать связь обратно (прочесть заметки, прочесть фейсбук, спросить температуру). Очевидно, разработчики не предоставили соответствующего API, но я не понимаю, почему. Уж если они календарь умеют читать, то могли бы и сообщения от IFTTT озвучивать, но нет.

Дальнейшее развитие

Резюмируя, я бы сказал, что за счет Skills у Alexa сейчас больше возможностей, чем у Google, но все это может появиться в нем довольно быстро. Кстати, полтора года назад Amazon запустил 100-миллионный венчурный фонд Alexa Fund для инвестиций в проекты, использующие голосовой интерфейс Alexa. У фонда уже 10 инвестиций, самая большая из которых — в Ecobee, термостат, который то ли уже обогнал, то ли вот-вот догонит по продажам Nest.

У Amazon также есть SDK Alexa Voice Service, позволяющий запускать сервис Alexa на железе сторонних разработчиков. Google пока не выпустил аналогичный SDK, планируют выпустить в этом году.

В целом, соревнование Amazon vs Google на поле Smart Home обещает быть интересным. Пока Гугл зафейлил попытку подмять платформы и протоколы неудачным проектом Brillo-Weave, Амазон вырвался вперед с развитием голосовых интерфейсов. Гугл теперь вынужден догонять, с задержкой примерно в год-полтора. Зато в активе Гугла более качественная голосовая библиотека, и вообще он умнее, лучше запрограммирован, так что ситуация близка к паритету. Если вы читаете эту статью с сугубо практическими целями и вы не американец, при выборе из двух устройств я бы предложил купить Гугл, так как он получше понимает и получше ищет. От сложных диалоговых интерфейсов из Skills Store мало толку, если вас не могут нормально понять.

Автор: Doobrovskiy

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js