- PVSM.RU - https://www.pvsm.ru -

Laurel-Yanny: аудиоверсия сине-золотого платья

Три года назад здесь уже обсуждали платье, которое разделило интернет [1]. На днях обнаружилась похожая, ещё более интересная и сложнее объяснимая иллюзия. Какое имя вы слышите на этой аудиозаписи: «Йенни» или «Лорел»?

Как выяснилось, результаты не только различаются от человека к человеку, но даже для одного человека могут зависеть от используемого аудиооборудования. Всю неделю лингвисты спорят о причинах иллюзии, пристально разглядывая спектрограмму этого двухсекундного фрагмента. Вот она:

Laurel-Yanny: аудиоверсия сине-золотого платья - 1

Для тех, кто видит спектрограмму звука впервые: по горизонтальной оси отложено время, по вертикальной — частоты, яркость точки соответствует амплитуде, с которой вибрирует «воображаемый камертон» соответствующей частоты в соответствующий момент времени. На спектрограмме речи всегда видны "форманты [2]" — тёмные горизонтальные линии, извилистые и прерывистые; каждая форманта соответствует одной из резонансных частот речевого аппарата, а их вертикальные колебания — соответственно, изменениям этих резонансных частот в процессе речи.

Как объясняет [3] Сюзи Стайлс, на участке низких частот до 5 КГц в человеческой речи присутствуют три форманты, которых обычно достаточно для разпознавания произносимых звуков. Эти три форманты соответствуют вертикальному (F1) и горизонтальному (F2) положению языка, и положению губ (F3). Сюзи даёт ссылку на ролик Общества Макса Планка [4], где диктор, находящийся в МРТ-камере, произносит по очереди все гласные и все согласные, так что за положением его органов речи при произношении каждого звука можно следить непосредственно.

И вот с выделением формант, по словам Сюзи, возникают проблемы: тёмные участки на спектрограмме yanni/laurel образуют рисунок из более чем трёх полос, которые разветвляются и пересекаются:

Laurel-Yanny: аудиоверсия сине-золотого платья - 2

В частности, нижняя полоса (F1) может распознаться либо «горбом вверх», либо «горбом вниз»:

Laurel-Yanny: аудиоверсия сине-золотого платья - 3

Первая линия соответствует последовательности гласных «высокий — низкий — высокий», т.е. [jæ-ɪ-]; вторая — «низкий — высокий — средний», т.е. [a-o-ə-]. (На рисунке Сюзи очевидная ошибка: [u] — высокий гласный, и не может быть в конце второй последовательности.) По F2 видно, что последовательность гласных должна быть «передний — средний — передний», т.е. опять же [jæ-ɪ-]. Но если аудиосистема слушателя подавляет частоты между 2 и 3 КГц, то слушатель «домысливает» F2 на основании F1, и получает последовательность гласных «задний-средний», т.е. [-o-ə-]:

Laurel-Yanny: аудиоверсия сине-золотого платья - 4

Сюзи подводит итог своего анализа: вместо трёх ясных формант мы видим путаницу из тёмных пятен, которую можно расшифровать одним из двух способов:

Laurel-Yanny: аудиоверсия сине-золотого платья - 5

Немного другой анализ приводит [5] Кэролин МакГеттиган. Когда стало известно, что «двусмысленный звук» не сконструирован коварными лингвистами для издевательства над нормальными людьми, а взят с сайта онлайн-словаря [6], пропущен через не очень качественные колонки, и записан не очень качественным микрофоном, — то Кэролин сравнила спектрограммы исходного звука с сайта, и получившегося «звука-иллюзии»:

Laurel-Yanny: аудиоверсия сине-золотого платья - 6 Laurel-Yanny: аудиоверсия сине-золотого платья - 7

В первом звуке F1 и F2 видны чётко, но очень близки; во втором, кроме добавления слабого шума, F1 и F2 слились в одну форманту, а исходная F3 стала восприниматься как F2. Кэролин отмечает, что «горб вниз» в F3 — это отличительная черта английского звука [ɹ]; а в получившемся звуке он вместо этого стал восприниматься как «горб вниз» в F2, т.е. как последовательность гласных «передний — средний — передний» — пресловутая [jæ-ɪ-].

Кроме этих двух объяснений иллюзии, лингвисты предложили ещё несколько. Бенджамин Муссон обратил внимание [7], что на высоких частотах (5-9, 9-13, 13-17 КГц) содержатся более слабые повторы F1-F3:

Laurel-Yanny: аудиоверсия сине-золотого платья - 8

В человеческой речи таких «повторяющихся формант» не бывает, так что Бенджамин обвиняет в иллюзии именно их. (Вероятнее всего, это артефакт аудиосжатия, использованного для «двусмысленного звука».)
NY Times — обсуждение иллюзии дошло даже дотуда [8]! — тоже обвиняет в иллюзии усиление высоких частот, произошедшее при перезаписи:

Laurel-Yanny: аудиоверсия сине-золотого платья - 9

Более того, в своей заметке они реализовали «интерактивную иллюзию» — частотный фильтр, настройку которого можно плавно менять ползунком, чтобы любой мог убедиться: если усиливать низкие частоты и подавлять высокие — то звук превращается в Laurel, если наоборот — то в Yanny.

Пользуясь поводом, упомяну здесь ещё и мою собственную акустико-фонетическую интерактивную штуку [9], написанную на коленке под вдохновением давнишнего квеста [10] от Meklon [11]'а. (Я ни разу не фронтендер, и охотно приму PR с более дружественным UI.) Эта интерактивная штука позволяет рисовать по спектрограмме и прямо в реальном времени слушать, какой получается звук; в частности, можно взять существующий звук и попытаться обвести его форманты, или дорисовать новые, или выборочно стереть какой-нибудь диапазон частот.

Автор: tyomitch

Источник [12]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/biotehnologii/280415

Ссылки в тексте:

[1] платье, которое разделило интернет: https://geektimes.com/post/246508/

[2] форманты: https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D0%BC%D0%B0%D0%BD%D1%82%D0%B0

[3] объясняет: https://twitter.com/suzyjstyles/status/996560301548945413

[4] ролик Общества Макса Планка: https://twitter.com/maxplanckpress/status/988696316648873984

[5] приводит: https://twitter.com/c_mcgettigan/status/996767667997507584

[6] взят с сайта онлайн-словаря: https://www.vocabulary.com/dictionary/laurel

[7] обратил внимание: http://languagelog.ldc.upenn.edu/nll/?p=38274

[8] даже дотуда: https://www.nytimes.com/interactive/2018/05/16/upshot/audio-clip-yanny-laurel-debate.html

[9] интерактивную штуку: https://tyomitch.github.io/

[10] давнишнего квеста: https://geektimes.ru/post/299221/

[11] Meklon: https://geektimes.com/users/meklon/

[12] Источник: https://geektimes.com/post/300947/?utm_campaign=300947