- PVSM.RU - https://www.pvsm.ru -

Распознавание речи для iOS

image

Недавно у меня возникла идея написать виртуального бота для общения. И хотя таковые уже существуют — речь пойдет не о приложении. Для претворения замысла в жизнь нужна была библиотека для распознавания голоса, и я стал искать. О результатах поиска далее.

Поиск убедил меня, что на данный момент наиболее популярными средствами распознавания речи на iOS являются:

  • OpenEars
  • Undocumented Google API for voice recognition

OpenEars

OpenEars [1] — открытый iOS фрэймворк, для распознавания и синтеза речи. Он позволяет легко реализовать распознавание английской речи и преобразования текста в речь на iPhone и IPad и используется с открытым исходным кодом CMU PocketSphinx, CMU Flite, и CMUCLMTK библиотеки. Является бесплатным для использования в iPhone и IPad приложений. На выбор присутствует 9 голосов. Содержит множество настроек. Не требует подключения к интернету, так как содержит офлайновый словарь. На сайте разработчиков подробно описаны подготовка к использованию и примеры.

Google API

OpenEars хорош во всем кроме словарного запаса. Тогда на выручку приходит не задокументированное Google API для распознавания речи. Используется оно в проекте Clojure [2]. Принцип прост: отправляете в Google запись в формате FLAC и получаете результат. Как это сделать хорошо описано в этой статье [3].

Надеюсь материал заинтересовал. Делитесь своими мнениями по поводу качества распознавания речи и инструментов для нее.

Автор: SeriiZ

Источник [4]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/raspoznavanie-rechi/22952

Ссылки в тексте:

[1] OpenEars: http://www.politepix.com/openears/

[2] Clojure: https://github.com/klutometis/speech-recognition

[3] этой статье: http://8byte8.com/blog/2012/07/voice-recognition-ios/

[4] Источник: http://habrahabr.ru/post/163109/