- PVSM.RU - https://www.pvsm.ru -

В начале этого года по ряду причин мы загорелись идеей создать самый большой открытый датасет русской речи. Подробнее о нашей мотивации и о том, как всё начиналось,
можно прочитать в этой статье — Огромный открытый датасет русской речи [1]. С тех пор наш проект [2] прошел через ряд масштабных изменений, мы в три раза увеличили количество данных, повысили их качество, добавили лейблы для спикеров и сейчас мы наконец готовы представить вам версию 1.0.
Также мы не готовы останавливаться на достигнутом и планируем продолжать делать интесивную работу над ошибками в последующих версиях и улучшать качество уже опубликованных данных. Версию 1.1 мы планируем посвятить масштабной работе над ошибками.
wav, в формате .mp3 конечно меньше);| Домен | Аннотация | Фразы | Часы | GB |
|---|---|---|---|---|
| Радио | Alignment | 8,3М | 11,996 | 1367 |
| Публичная речь | Alignment | 1,7M | 2,709 | 301 |
| Youtube | Субтитры | 2,6М | 2,117 | 346 |
| Книги | Alignment/ASR | 1,3М | 1,632 | 180 |
| Звонки | ASR | 695K | 819 | 91 |
| Другие датасеты | TTS, начитывание | 1.9M | 835 | 95 |
Более детально со статистикой можно познакомиться в репозитории [2] проекта.
.wav(mono, 16KHz, int16) формате через торрент, так и по прямой ссылке в .mp3;Мы приложили максимум усилий для повышения качества разметки:
Подробнее познакомиться с новыми доменами можно в репозитории [2]
Автор: Alexander
Источник [3]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/open-source/335494
Ссылки в тексте:
[1] Огромный открытый датасет русской речи: https://habr.com/ru/post/450760/
[2] проект: https://github.com/snakers4/open_stt
[3] Источник: https://habr.com/ru/post/474462/?utm_source=habrahabr&utm_medium=rss&utm_campaign=474462
Нажмите здесь для печати.