- PVSM.RU - https://www.pvsm.ru -

yandex-speech — wrapper к речевым технологиям Яндекса

Ознакомившись с обзором движков для распознавания речи [1], заметил там API от Яндекса. И на выходных написал небольшую обертку для Node.js для распознавания речи с целью поиска мата в своих телефонных разговорах. По мотивам топика [2] на Хабре.

Список нецензурных слов выкладывать не буду, а сам npm устанавливается командой.

npm install yandex-speech

Исходники и примеры использования:
github: www.github.com/antirek/yandex-speech [3]

Немного деталей:

Ключ API активировали в течение трех часов. В запросе так и написал: «нужен тестовый ключ, запросов будет 10-20 штук в день». Ключ, указанный в примерах, блокирован. Запросите, пожалуйста, свой: developer.tech.yandex.ru/ [4]

В документации [5] написан пример, подобный запросу curl типа
curl -v -4 -H "Content-Type: audio/x-mpeg-3" -d "@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Оказалось, что можно и так отправить:
curl -v -4 -F "Content-Type=audio/x-mpeg-3" -F "audio=@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Добавил проверку размера отправляемого аудиофайла, не более 1Мб, т.к. сервис ругается на файлы большего размера.

Также добавил враппер для генерации аудиофайла по тексту. Неофициальное API по мотивам комментария [6] на Хабре. Чтобы и text2speech, и speech2text в одном флаконе.

Надеюсь, что кому-то еще пригодится в хозяйстве. Вопросы, пожелания, критика по коду?

Автор: antirek

Источник [7]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/javascript/67247

Ссылки в тексте:

[1] обзором движков для распознавания речи: http://habrahabr.ru/post/231629/

[2] топика: http://habrahabr.ru/post/225179/

[3] www.github.com/antirek/yandex-speech: http://www.github.com/antirek/yandex-speech

[4] developer.tech.yandex.ru/: https://developer.tech.yandex.ru/

[5] документации: http://api.yandex.ru/speechkit/cloud-api/doc/index.xml

[6] комментария: http://habrahabr.ru/post/225179/#comment_7658675

[7] Источник: http://habrahabr.ru/post/232861/