- PVSM.RU - https://www.pvsm.ru -

История синтеза речи: эпоха электрических решений

В прошлый раз мы рассказывали [1] о механических устройствах для синтеза речи — голосовом тракте Кемпелена и «говорящей голове» Иосифа Фабера. На очереди электрические синтезаторы XX века.

История синтеза речи: эпоха электрических решений - 1 [2]
Фото Rock'n Roll Monkey [3] / Unsplash

Первые электрические установки

В 1850 году немецкий физик и врач-физиолог Герман фон Гельмгольц представил свою резонаторную теорию [4]. Он заметил, что у гласных звуков разные резонансные частоты (форманты). Эти форманты образуются при прохождении звуковой волны от голосовых связок к губам. Некоторые волны отражаются от губ говорящего и идут к реципиенту, а часть — возвращается к источнику. Ученый предположил, что голосовой тракт человека можно представить как последовательность резонаторов.

В начале XX века начались попытки реализовать такую модель на основе электрических компонентов. Первый синтезатор такого типа разработал физик Джон Стюарт. Его схема (опубликованная [5] в журнале Nature), включала в себя электрический зуммер для моделирования связок и пару индуктивно-емкостных резонаторов. Они эмулировали физические процессы, происходящие со звуком в горле.

История синтеза речи: эпоха электрических решений - 2

Схема синтезатора, разработанного Джоном Стюартом

Устройство Стюарта могло издавать звуки, состоящие из двух формант. Это — несколько простых гласных, а также дифтонги [6]. Но на этом его возможности заканчивались.

Первый электрический синтезатор, способный воспроизводить речь появился [7] позже — в 1930 годах. Его разработал Гомер Дадли (Homer Dudley) из Bell Laboratories. В то время компания работала над вокодером [8] — инструментом для сжатия речи и экономии частотных ресурсов радиолинии в телефонных сетях. Идея заключалась в том, чтобы вместо голоса абонента передавать его ключевые параметры. На принимающей стороне устанавливался специальный декодер, который по этим параметрам реконструировал и воспроизводил звук. Дадли понял, что с небольшими модификациями вокодер можно превратить в полноценный синтезатор. Так появилась система VODER [9] — Voice Operating Demonstrator.

Устройство представили широкой публике на нью-йоркской всемирной выставке в 1939 году. В конструкцию VODER входили [10] два источника звука: ламповый генератор шума для «глухих» фонем, и осциллятор — для «звонких». Также имелись десять параллельно соединенных полосовых фильтров — они составляли блок управления резонансами. Оператор руководил системой с помощью ручной клавиатуры, браслета на запястье и ножной педали.

Во время демонстраций аппарат говорил на разных языках, пел и отвечал на вопросы с различными интонациями. Но чтобы раскрыть потенциал системы, её оператору требовались годы тренировок.

Вскоре после премьеры VODER началась Вторая мировая война, и Bell Labs пришлось свернуть дальнейшую разработку синтезатора. Однако знания, полученные во время работы над проектом, Гомер Дадли использовал [11] для создания технологии шифрования телефонных разговоров.

Синтезаторы речи на спектрограммах

В 1946 году был изобретен [12] акустический спектрограф. И возникла идея — использовать спектрограммы для управления речевыми синтезаторами. Одним из первых такое устройство представил Л. Шотт (L. Schott), американский инженер из Bell Labs. Он использовал линейный источник света, просвечивающий спектрографические шаблоны с разной степенью прозрачности. Специальные фотоэлементы, установленные напротив лампы, регистрировали изменения уровня освещенности и генерировали управляющие сигналы для полосовых фильтров. Точно такие же фильтры использовал Гомер Дадли для своего VODER.

Фото 120years.net [13]
История синтеза речи: эпоха электрических решений - 3Другую разработку в этой области представила группа американских ученых во главе с физиком Франклином Купером (Franklin Cooper [14]). Их оптическая система — Pattern Playback [15] — модулировала гармоники основного тона 120 Гц, считывая изображения на движущейся прозрачной ленте. Визуальная информация передавалась осциллятору, превращавшему её в звук.

В каком-то смысле система напоминала советские оптические синтезаторы [16] — «Нивотон» и «Вариофон» — на которых писали музыку для мультфильмов. Однако Pattern Playback был изначально «заточен» под генерацию человеческой речи и умел воспроизводить целые предложения.

Устройства, подобные Pattern Playback и VODER, построили теоретический фундамент для проектирования формантных и артикуляционных синтезаторов. Они стали прототипом современного компьютерного синтеза. О них мы расскажем в следующий раз.


Материалы по теме из нашего «Мира Hi-Fi»:

История синтеза речи: эпоха электрических решений - 4 История аудиотехнологий: синтезаторы и сэмплеры [17]
История синтеза речи: эпоха электрических решений - 5 Траутониум: немецкая волна в истории синтезаторов [18]
История синтеза речи: эпоха электрических решений - 6 Музыка из бумаги и картона: краткая история вариофона и «рисованного звука» [16]
История синтеза речи: эпоха электрических решений - 7 «Машинный звук»: синтезаторы на базе нейросетей [19]
История синтеза речи: эпоха электрических решений - 8 Звук на проволоке: история телеграфона [20]


Автор: Audioman

Источник [21]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/staroe-zhelezo/349146

Ссылки в тексте:

[1] рассказывали: https://habr.com/ru/company/audiomania/blog/490596/

[2] Image: https://habr.com/ru/company/audiomania/blog/491746/

[3] Rock'n Roll Monkey: https://unsplash.com/photos/R4WCbazrD1g

[4] резонаторную теорию: https://ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%B7%D0%BE%D0%BD%D0%B0%D0%BD%D1%81_%D0%93%D0%B5%D0%BB%D1%8C%D0%BC%D0%B3%D0%BE%D0%BB%D1%8C%D1%86%D0%B0

[5] опубликованная: http://www.haskins.yale.edu/featured/heads/SIMULACRA/stewart.html

[6] дифтонги: https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D1%84%D1%82%D0%BE%D0%BD%D0%B3

[7] появился: http://research.spa.aalto.fi/publications/theses/lemmetty_mst/chap2.html

[8] вокодером: https://ru.wikipedia.org/wiki/%D0%92%D0%BE%D0%BA%D0%BE%D0%B4%D0%B5%D1%80

[9] VODER: https://en.wikipedia.org/wiki/Voder

[10] входили: http://www.haskins.yale.edu/featured/heads/SIMULACRA/voder.html

[11] использовал: https://en.wikipedia.org/wiki/Homer_Dudley#SIGSALY_and_wartime_projects

[12] был изобретен: https://asa.scitation.org/doi/abs/10.1121/1.1916342

[13] 120years.net: http://120years.net/pattern-playback-franklin-s-cooper-usa-1949/

[14] Franklin Cooper: https://en.wikipedia.org/wiki/Franklin_S._Cooper

[15] Pattern Playback: https://120years.net/pattern-playback-franklin-s-cooper-usa-1949/

[16] советские оптические синтезаторы: https://www.audiomania.ru/content/art-6105.html

[17] История аудиотехнологий: синтезаторы и сэмплеры: https://www.audiomania.ru/content/art-6552.html

[18] Траутониум: немецкая волна в истории синтезаторов: https://www.audiomania.ru/content/art-6472.html

[19] «Машинный звук»: синтезаторы на базе нейросетей: https://www.audiomania.ru/content/art-6147.html

[20] Звук на проволоке: история телеграфона: https://www.audiomania.ru/content/art-6495.html

[21] Источник: https://habr.com/ru/post/491746/?utm_source=habrahabr&utm_medium=rss&utm_campaign=491746