- PVSM.RU - https://www.pvsm.ru -
Недавно мы закончили проект по синтезу якутского языка. Хотя наши договорённости не позволяют выложить нам модели в общий доступ, какими-то соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.
Под котом катом вы узнаете:
Как звучит синтез на якутском языке;
Чем отличается якутский алфавит от русского и какие "дополнительные" звуки там есть;
Как работать с ударениями на якутском языке, с учетом полного отсутствия каких-либо корпусов или словарей;
И, в качестве бонуса, как якутский синтез речи говорит на русском с якутским акцентом;
Возможно вы никогда его не слышали (или не отдавали себе отчёт, что звучит именно якутский), но звучит он так:
Это случайные фразы синтезированные на якутском. Если он для вас - родной, отпишите, пожалуйста, в комментариях.
Начнём с простого, а именно с алфавита. Нам всем очень повезло, на самом деле. Ситуаций как со словами по типу the / though / thought / Thomas / eighth / lighthouse ни в русском, ни в якутском нет.
В русском как слышится так и пишется с учётом ударения (да, я понимаю, это огромное допущение), а в якутском так же, но ударение мало влияет на произношение слова. И большая часть звуков нам известна. Нам также повезло, что алфавит унифицирован с кириллицей и письмо фонетическое (современный алфавит существует с 1939 года и с тех пор официально не подвергался правкам).
|
Кириллица |
IPA |
Примечания |
|---|---|---|
|
А а |
[a] |
|
|
Б б |
[b] |
|
|
В в |
[v] |
Только в заимствованных словах |
|
Г г |
[g] |
|
|
Ҕ ҕ |
[ɣ], [ʁ] |
"Г с крюком" (фрикативный "г") |
|
Д д |
[d] |
|
|
Дь дь |
[ɟ] |
"Д с мягким знаком" (сверхмягкий "дь") |
|
Е е |
[e], [je] |
Только в заимствованных словах |
|
Ё ё |
[jo] |
Только в заимствованных словах |
|
Ж ж |
[ʒ] |
Только в заимствованных словах |
|
З з |
[z] |
Только в заимствованных словах |
|
И и |
[i] |
|
|
Й й |
[j], [j̃] |
|
|
К к |
[k], [q] |
|
|
Л л |
[l] |
|
|
М м |
[m] |
|
|
Н н |
[n] |
|
|
Ҥ ҥ |
[ŋ] |
Лигатура "нг" (заднеязычное "н") |
|
Нь нь |
[ɲ] |
"Н с мягким знаком" (сверхмягкое "н") |
|
О о |
[o] |
|
|
Ө ө |
[ø] |
"О с перекладиной" |
|
П п |
[p] |
|
|
Р р |
[r] |
|
|
С с |
[s] |
|
|
Һ һ |
[h] |
|
|
Т т |
[t] |
|
|
У у |
[u] |
|
|
Ү ү |
[y] |
Прямая "у" |
|
Ф ф |
[f] |
Только в заимствованных словах |
|
Х х |
[x] |
|
|
Ц ц |
[ʦ] |
Только в заимствованных словах |
|
Ч ч |
[ʧ] |
|
|
Ш ш |
[ʃ] |
Только в заимствованных словах |
|
Щ щ |
[ɕː] |
Только в заимствованных словах |
|
Ъ ъ |
. |
Только в заимствованных словах |
|
Ы ы |
[ɯ] |
Заднеязычное, неогублённое "у" |
|
Ь ь |
[ʲ] |
Только в заимствованных словах |
|
Э э |
[e] |
|
|
Ю ю |
[ju] |
Только в заимствованных словах |
|
Я я |
[ja] |
Только в заимствованных словах |
Как мы видим, существенная часть алфавита вообще используется только в заимствованных словах (из русского языка в первую очередь), но также есть аж четыре разные группы "звуков", у которых нет аналогов в русском языке (ну или они совсем редкие или используются в заимствованных словах):
дь и нь хоть формально и не являются буквами, но обозначают звуки ɟ и ŋ, аналогов которых в русском нет;
Буквы ҕ, ҥ, ө, һ, ү обозначают звуки ɣ, ŋ, ø, h, y и не имеют аналогов в русском языке;
Дифтонги ыа, уо, иэ и үө;
Длинные звуки аа, оо, ыы, уу, ии, ээ, үү, өө;
Далее мы подробно пройдемся по каждому из звуков, приведём примеры его звучания и опишем понятными словами как он звучит и на что похож.
Также якутский на слух звучит немного "нараспев". Это происходит потому, что в якутском языке есть пять долгих гласных (аа, ыы, уу, ии, үү), встречающихся лишь в корне. Дифтонги, возникшие в результате соединения звуков, встречаются в любом слоге.
Употребление гласных звуков подчиняется правилу гармонии гласных, при котором гласные в слове следуют друг за другом в строго определённом порядке. Например, если в предыдущем слоге стоит звук ы, то в следующем может быть только ы или а, или ыа: ылыым, ылаар, ылыа.
Еще важно затронуть палатализацию ("смягчение" согласных перед гласными звуками). В русском языке она встречается повсеместно. В якутском палатализация перед гласными и, э, ө, ү, иэ, үө - присутствует не у всех согласных. У л, м, т, c - присутствует. По поводу н - спорно, ведь есть звук нь.
Опишем звуки, которых нет в русском языке:
Сочетание букв дь передаёт звук [1] ɟ, который русскими буквами можно записать примерно как дьй;
Сочетание букв нь передаёт звук [2] ɲ, который похож нь или nʲ, однако нь - альвеолярный звук (передняя часть языка соприкасается с альвеолярным отростком), а в палатальном носовом согласном ɲ средняя часть языка соприкасается с твёрдым нёбом. Самый простой пример - тут английское слово onion или любое испанское слово с буквой ñ, например señor;
Звук ɣ , передаваемый буквой ҕ, читателю скорее известен как звук между г и х из русских южных диалектов, или звук буквы г в словах господи, ага, Бог;
Носовой звук [2] ŋ передаваемый буквой ҥ, читателю скорее всего известен из английского языка в словах типа thing, заканчивающихся на -ing;
Буква ө передаёт звук [3] ø, который нам известен из "немецких слов с точками", например schön, и звучит как нечто среднее между о и у;
Буква һ передаёт звук [4] h, который читателю известен как английское "легкое" х на выдохе, например в слове high;
Буква ү передаёт звук [5] y, который вы наверное все слышали миллион раз в слове über в разных контекстах;
Послушать примеры слов с указанными звуками можно ниже:
Фух, можно выдохнуть. По сути дифтонги это просто сочетания звуков, а долгие звуки это как будто два звука, идущих подряд. С этим связано ударение, но об этом чуть дальше.
Послушаем эти звуки.
Не секрет, что например на английском языке без перевода слов в фонемы в синтезе речи обойтись нельзя, потому что там пишется "понедельник, а читается четверг".
В русском языке всё обстоит получше, но нужно знать ударение. Кроме редких примеров типа "солнце" или "дожди", если проставить ударение, чтение слова довольно однозначно.
Но как обстоят дела в якутском языке? Оказывается, что ударений как таковых в нём как будто бы нет. Мы задавали вопросы разным носителям языка и лингвистам, и не получили консенсуса. На Википедии на эту тему вообще написано что-то странное.
Естественно по причине того, что у языка мало носителей и из-за "простой" фонетики - мы не нашли публично доступных орфоэпических словарей или словарей с ударениями.
Но даже если ударения нет, нужно иметь систему, которая была бы совместима с русским языком, если например нужно будет вставить русское слово, не "адаптируя" его на якутский. А у русских слов нужно иметь возможность проставлять ударения.
По этой причине наш коллега, говорящий на якутском языке, сел отслушивать записи на якутском, и пришёл к выводу, что ударение несильное и падает или на все слоги сразу, или там где стоит дифтонг или двойная гласная.
Распарсив корпус слов, получившийся от анализа сайтов СМИ на якутском, мы смогли расставить "ударения" с помощью правил, чтобы они работали обратно совместимо с русским языком.
Так, отлично. Палатализация не очень ярко выражена, практически всё как слышится так и пишется, ударения можно не ставить, но мы лучше поставим.
По сути после записи корпусов речи на русском и якутском остается только ответить на ряд вопросов / гипотез, чтобы наконец определиться с дизайном системы синтеза речи:
Использовать графемы или фонемы? Тут выбор точно в пользу графем. У обоих языков письмо "фонетическое";
В экспериментах с фонемами у нас лучше работали модели, где палатализация выделена в отдельный символ. А в экспериментах с графемами лучше работало … когда мы просто подавали графемы "как есть". Получается тут тоже особо без вариантов;
Вопрос как подавать ударение по идее тоже не особо стоит - отдельным символом для обоих языков. Мы пробовали НЕ подавать ударения для якутского языка, но модель начинала "путаться". Если не подавать ударения в русский язык … ну можно не продолжать;
По сути остаётся только решить как подавать дифтонги и длинные гласные. Мы пробовали как выделять отдельные символы на них, так и наивный способ, огромной разницы не увидели. Значит действуем по пути сокращения сущностей;
Получается, что если грамотно решить вопрос с ударениями, то можно получить простую в использовании систему синтеза языка, которая будет сразу работать на двух языках и позволит также "говорить на русском с якутским акцентом" и наоборот.
В качестве бонуса вот несколько аудио русской синтезированной речи с "якутским акцентом".
Тут триллера особо не получилось, мы просто аккуратно исследовали предметную область и сделали синтез речи на якутском, который работает одновременно и на русском языке. Несмотря на кажущуюся экзотику или сложность, на самом деле нам очень "повезло" с фонетическим алфавитом языка и тем, что один из нас говорит на якутском.
Также нужно ещё отметить, что вопреки популярным трендам в духе "закинуть все данные в сетку на сотни миллиардов параметров", наша модель работает даже на 1-4 потоках процессора локально и показывает очень бодрые показатели скорости.
В таблице указаны секунды сгенерированного аудио в секунду.
Впереди нас ждёт ещё 8 языков, но там, к сожалению, так "просто" уже не будет ...
Долго боролся с аудио, некоторые файлы он не принимает вообще никак. Поэтому если кого-то очень заинтересуют все файлы, вот ссылка [7] на гугл-диск.
Автор: snakers4
Источник [8]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/sintez-rechi/394086
Ссылки в тексте:
[1] звук: https://ru.wikipedia.org/wiki/%D0%9F%D0%B0%D0%BB%D0%B0%D1%82%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5_%D0%B2%D0%B7%D1%80%D1%8B%D0%B2%D0%BD%D1%8B%D0%B5_%D1%81%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B5
[2] звук: https://ru.wikipedia.org/wiki/%D0%92%D0%B5%D0%BB%D1%8F%D1%80%D0%BD%D1%8B%D0%B9_%D0%BD%D0%BE%D1%81%D0%BE%D0%B2%D0%BE%D0%B9_%D1%81%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B9
[3] звук: https://ru.wikipedia.org/wiki/%D0%9E%D0%B3%D1%83%D0%B1%D0%BB%D1%91%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D0%B5%D0%B4%D0%BD%D0%B5%D0%B3%D0%BE_%D1%80%D1%8F%D0%B4%D0%B0_%D1%81%D1%80%D0%B5%D0%B4%D0%BD%D0%B5-%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%B5%D0%B3%D0%BE_%D0%BF%D0%BE%D0%B4%D1%8A%D1%91%D0%BC%D0%B0
[4] звук: https://ru.wikipedia.org/wiki/%D0%93%D0%BB%D1%83%D1%85%D0%BE%D0%B9_%D0%B3%D0%BB%D0%BE%D1%82%D1%82%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9_%D1%89%D0%B5%D0%BB%D0%B5%D0%B2%D0%BE%D0%B9_%D1%81%D0%BE%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B9
[5] звук: https://ru.wikipedia.org/wiki/%D0%9E%D0%B3%D1%83%D0%B1%D0%BB%D1%91%D0%BD%D0%BD%D1%8B%D0%B9_%D0%B3%D0%BB%D0%B0%D1%81%D0%BD%D1%8B%D0%B9_%D0%BF%D0%B5%D1%80%D0%B5%D0%B4%D0%BD%D0%B5%D0%B3%D0%BE_%D1%80%D1%8F%D0%B4%D0%B0_%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%B5%D0%B3%D0%BE_%D0%BF%D0%BE%D0%B4%D1%8A%D1%91%D0%BC%D0%B0
[6] хостингом: https://www.reg.ru/?rlink=reflink-717
[7] ссылка: https://drive.google.com/drive/folders/1arNe1jlZUvbY2kd-tnm7cmkCmEoAmgDR
[8] Источник: https://habr.com/ru/articles/837364/?utm_campaign=837364&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.