Команда Yandex Cloud объявила о своей новой разработке — нейросети, способную разговаривать более чем на десяти языках.
Как отмечают разработчики, новая модель в Yandex SpeechKit на базе машинного обучения умеет распознавать более 10 иностранных языков одновременно. С помощью новой нейросети компании смогут проще и быстрее создавать многоязычных голосовых помощников и мультиязычных голосовых роботов для колл-центров с большим потоком клиентов.
Нейросеть-полиглот умеет работать как с популярными языками, такими как английский и французский, так и с более редкими — датским, финским, турецким. Модель распознает речь на любую тему и в разных форматах: короткие и длинные фразы, а также имена, адреса, даты и числа. Она умеет распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.
Новая мультиязычная модель работает на базе архитектуры Transformer. «Трансформеры» обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются.
Новое мультиязычное распознавание уже доступно для пользователей Yandex SpeechKit и настраивается стандартными средствами в API.