Я угадаю эту мелодию по трем нотам!

в 6:48, , рубрики: big data, IBM, Блог компании IBM, диагностика болезней, музыка, паттерны

Я угадаю эту мелодию по трем нотам!

Так может ответить сейчас специально обученный командой исследователей компьютерный алгоритм, способный определять принадлежность мелодии к различным периодам (барокко, классицизм, романтизм и постромантизм) всего по трем нотам из любой части музыкальной композиции.

Правда, саму композицию по трем нотам система идентифицировать не сможет. Но это и не требуется — разработчики поставили перед собой задачу проанализировать эволюцию музыки за период в 200 лет (1730-1930 гг), и научить компьютерную систему правильно определять принадлежность мелодии к одному из указанных выше периодов/стилей.

Суть исследования

Разработчики попробовали выделить отдельные паттерны для каждого периода/стиля, включая текстуру мелодии, гармонию, ритм и мелодию.

Обучение компьютерной системы проводилось по базе известного сервиса Peachnote, в который ранее было добавлено более 20 тысяч музыкальных произведений описанных выше стилей. Машина смогла выделить определенные паттерны музыкальных произведений по полутонам или нотам. После проведения кластерного анализа, полученные результаты были сведены в единый график, на котором и показаны этапы эволюции музыкальных стилей, а также переходы между стилями.

Я угадаю эту мелодию по трем нотам!
Здесь достаточно точно показан переход между различными музыкальными стилями прошлого.

Компьютер помог выявить уникальные признаки каждого из анализируемых музыкальных стилей, также была определена четкая связь между распределением интервалов в определенной музыкальной композиции и способностью человека предсказать развитие звуковой композиции. Кстати, популярная теория утверждает, что человек как раз и способен предсказать развитие музыкальной композиции всего по трем нотам. Как видим, теперь то же может делать и компьютерная система, после соответствующего обучения.

Насколько можно судить, человек воспринимает музыку в зависимости от подсознательного «ожидания» распределения музыкальных интервалов в каждой конкретной композиции. Основной критерий — расстояние между двумя последовательными нотами. Соответственно, по трем нотам человек (и теперь компьютер) может предсказать, как будет развиваться музыкальная композиция.

Зачем все это?

В принципе, ученые/инженеры зачастую изучают что-то/строят теории ради чистой науки, без применения к практике. В этом случае авторы проекта надеются применить свои наработки и для выделения паттернов человеческой речи. Делается это для ранней диагностики болезни Паркинсона, например, когда с моторикой еще все хорошо, но голос уже меняется, и только компьютерный анализ способен это показать, выявляя заболевание на ранней стадии.

Кроме болезни Паркинсона, выделять характерные паттерны голоса человека можно и для других заболеваний, в том числе, психических.

Вероятно, уже в недалеком будущем подобные заболевания можно будет диагностировать без проблем, при вербальном общении с человеком (например, по телефону).

Автор: marks

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js