- PVSM.RU - https://www.pvsm.ru -
Компания Google сделала подарок сторонним разработчикам — и открыла доступ к программным интерфейсам Cloud Speech API [1]. В первое время доступ предоставляется на бесплатной основе, тарифы объявят позже.
Распознавание речи работает для 80 языков. Возможно распознавание речи в прямом эфире через микрофон или аудиозаписей из файлов (вероятно, до 2 минут [2]). Поддерживаются многочисленные форматы, в том числе FLAC, AMR и PCMU.
Теперь для любой программы можно встроить, например, голосовое управление через Cloud Speech API. Система выдаёт распознанный текст мгновенно в процессе работы.
Google утверждает, что Speech API достаточно точно работает даже с зашумлённым фоном, так что материал не требуется предварительно очищать, обрабатывая фильтрами или используя дорогое оборудование и микрофоны для шумоподавления.
Для некоторых языков поддерживается автоматическая фильтрация нежелательного контента.
Слухи об открытии интерфейсов ходили в последнее несколько недель. Эксперты выражали мнение, что Google собирается выйти на рынок, где сейчас работает Nuance и некоторые другие компании, специализирующиеся на распознавании речи. Теперь тягаться с Google им будет тяжело, в её системе используются последние разработки в области самообучаемых нейросетей — тот же движок, что и в голосовом поиске Google и голосовом наборе с клавиатуры Google. С каждым месяцем Cloud Speech API будет распознавать текст всё точнее.
Новость о Cloud Speech API компания объявила [3] вчера на конференции NEXT [4]. Кроме распознавания речи, теперь разработчикам открыт доступ к платформе машинного обучения Cloud Machine Learning [5].
Открытие Google API для распознавания речи ударит не только по специализированным компаниям, но и по Apple, у которой голосовой помощник Siri значительно уступает нейросети Google по точности распознавания и функциональности.
Автор: alizar
Источник [6]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/google/116049
Ссылки в тексте:
[1] Cloud Speech API: https://cloud.google.com/speech/
[2] до 2 минут: https://services.google.com/fb/forms/speech-api-alpha/
[3] объявила: https://cloudplatform.googleblog.com/2016/03/Google-takes-Cloud-Machine-Learning-service-mainstream.html
[4] NEXT: https://cloudplatformonline.com/NEXT2016-schedule.html
[5] Cloud Machine Learning: https://cloud.google.com/ml/
[6] Источник: https://geektimes.ru/post/273282/
Нажмите здесь для печати.