- PVSM.RU - https://www.pvsm.ru -

Google открывает API для распознавания речи на 80 языках

Google открывает API для распознавания речи на 80 языках - 1Компания Google сделала подарок сторонним разработчикам — и открыла доступ к программным интерфейсам Cloud Speech API [1]. В первое время доступ предоставляется на бесплатной основе, тарифы объявят позже.

Распознавание речи работает для 80 языков. Возможно распознавание речи в прямом эфире через микрофон или аудиозаписей из файлов (вероятно, до 2 минут [2]). Поддерживаются многочисленные форматы, в том числе FLAC, AMR и PCMU.

Теперь для любой программы можно встроить, например, голосовое управление через Cloud Speech API. Система выдаёт распознанный текст мгновенно в процессе работы.

Google утверждает, что Speech API достаточно точно работает даже с зашумлённым фоном, так что материал не требуется предварительно очищать, обрабатывая фильтрами или используя дорогое оборудование и микрофоны для шумоподавления.

Для некоторых языков поддерживается автоматическая фильтрация нежелательного контента.

Слухи об открытии интерфейсов ходили в последнее несколько недель. Эксперты выражали мнение, что Google собирается выйти на рынок, где сейчас работает Nuance и некоторые другие компании, специализирующиеся на распознавании речи. Теперь тягаться с Google им будет тяжело, в её системе используются последние разработки в области самообучаемых нейросетей — тот же движок, что и в голосовом поиске Google и голосовом наборе с клавиатуры Google. С каждым месяцем Cloud Speech API будет распознавать текст всё точнее.

Новость о Cloud Speech API компания объявила [3] вчера на конференции NEXT [4]. Кроме распознавания речи, теперь разработчикам открыт доступ к платформе машинного обучения Cloud Machine Learning [5].

Открытие Google API для распознавания речи ударит не только по специализированным компаниям, но и по Apple, у которой голосовой помощник Siri значительно уступает нейросети Google по точности распознавания и функциональности.

Автор: alizar

Источник [6]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/google/116049

Ссылки в тексте:

[1] Cloud Speech API: https://cloud.google.com/speech/

[2] до 2 минут: https://services.google.com/fb/forms/speech-api-alpha/

[3] объявила: https://cloudplatform.googleblog.com/2016/03/Google-takes-Cloud-Machine-Learning-service-mainstream.html

[4] NEXT: https://cloudplatformonline.com/NEXT2016-schedule.html

[5] Cloud Machine Learning: https://cloud.google.com/ml/

[6] Источник: https://geektimes.ru/post/273282/