yandex-speech — wrapper к речевым технологиям Яндекса

в 15:25, , рубрики: api, javascript, node.js, nodejs, text-to-speech, TTS, voice recognition, Yandex

Ознакомившись с обзором движков для распознавания речи, заметил там API от Яндекса. И на выходных написал небольшую обертку для Node.js для распознавания речи с целью поиска мата в своих телефонных разговорах. По мотивам топика на Хабре.

Список нецензурных слов выкладывать не буду, а сам npm устанавливается командой.

npm install yandex-speech

Исходники и примеры использования:
github: www.github.com/antirek/yandex-speech

Немного деталей:

Ключ API активировали в течение трех часов. В запросе так и написал: «нужен тестовый ключ, запросов будет 10-20 штук в день». Ключ, указанный в примерах, блокирован. Запросите, пожалуйста, свой: developer.tech.yandex.ru/

В документации написан пример, подобный запросу curl типа
curl -v -4 -H "Content-Type: audio/x-mpeg-3" -d "@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Оказалось, что можно и так отправить:
curl -v -4 -F "Content-Type=audio/x-mpeg-3" -F "audio=@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Добавил проверку размера отправляемого аудиофайла, не более 1Мб, т.к. сервис ругается на файлы большего размера.

Также добавил враппер для генерации аудиофайла по тексту. Неофициальное API по мотивам комментария на Хабре. Чтобы и text2speech, и speech2text в одном флаконе.

Надеюсь, что кому-то еще пригодится в хозяйстве. Вопросы, пожелания, критика по коду?

Автор: antirek

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js