- PVSM.RU - https://www.pvsm.ru -

Нейросеть-полиглот Яндекса заговорила на узбекском языке

Команда Yandex Cloud объявила о своей новой разработке — нейросетей, которые могут распознавать речь и воспроизводить ее на узбекском языке. Компании как в России, так и в Узбекистане уже могут использовать новый язык в сервисе Yandex SpeechKit для создания голосовых помощников, автоматизации колл-центров и речевой аналитики.

Нейросеть-полиглот Яндекса заговорила на узбекском языке [1]
Сгенерировано нейросетью Midjourney

Как отмечают разработчики, для обучения нейросети синтезу нужно минимум 30 часов качественной записи диктора в студии, а вот для распознавания лучше подойдут записи с шумами, кашлем и помехами.

Нейросети для синтеза и распознавания узбекского работают с латинским алфавитом, который используется в Узбекистане уже больше 20 лет. При этом алгоритмам пришлось выучить и некоторые звуковые особенности букв. Например, буква «X» обозначает в алфавите твердый [х], а в иностранных словах может произноситься как [кс].

Нейросеть-полиглот Яндекса заговорила на узбекском языке [1]
Иллюстрация: Yandex Cloud

Модели доступны на сайте и настраиваются стандартными средствами в API [2]. Синтез и распознавание узбекского языка с помощью Yandex SpeechKit уже начал использовать ряд компаний, в том числе, например, Kolesa Group. Также технологию уже тестируют интегрируют в свои решения компании-партнеры, в том числе Tomoru, JustAI, Unistar Digital и TargetAI.
 

Источник [3]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/news/385396

Ссылки в тексте:

[1] Image: #

[2] стандартными средствами в API: https://www.ixbt.com/click/?c=53616c7465645f5f5dd7978e471aeb0f862f286a12fc08b9a5565c82d70e0202212d3b8ce1766f3b21676833e79ee5556ed29faf065c05ad7d806e5881c337d1e7a4008f4e9754c728827ddb4636980f0a8f82149c966e30006f3f6a3c32ebae&h=2e756e133b4717faf98018cdf01e77499d39ff87

[3] Источник: https://www.ixbt.com/news/2023/06/15/nejrosetpoliglot-jandeksa-zagovorila-na-uzbekskom-jazyke.html