- PVSM.RU - https://www.pvsm.ru -

«Музыка завтрашнего дня»: какие технологии могут изменить процесс записи и презентации музыкальных треков

Записать песню на удаленке уже не проблема — мы рассказывали [1] об инструментах, которые позволяют сделать это. Так, фронтмен британской рок-группы Oasis ни разу не встречался с басистом, участвовавшим в записи альбома Who Built The Moon?

Мы решили продолжить тему, немного повизионерствовать и обсудить технологии, которые изменят (и уже меняют) подходы к написанию и исполнению музыки.

Фотография: JOSHUA COLEMAN. Источник: Unsplash.com
Фотография: JOSHUA COLEMAN. Источник: Unsplash.com

Нейросети и споют, и спродюсируют

Такие алгоритмы машинного обучения разрабатывают специалисты в корпорациях и исследовательских лабораториях. Инженеры из OpenAI представили инструмент Jukebox, способный генерировать песни с осмысленными текстами и вокалом [2]. Нейросеть обучили на датасете из миллионов композиций разных жанров [3]: от регги и кантри до рока и хип-хопа. ML-модель использует вариационный автокодировщик VQ-VAE. Он сжимает аудио, сохраняя акустическую информацию о громкости, тембре и высоте звука. На основе этих данных формируется [4] новая аудиодорожка.

Другой пример — альбом Hello World [5] от композитора SKYGGE. Он целиком записан с помощью нейросетей. На BBC его назвали [6] первым действительно хорошим альбомом от робота. При этом два самых популярных трека — «Magic Man [7]» и «Hello Shadow [8]» — в сумме собрали почти 10 млн прослушиваний на Spotify.

Несмотря на популярность, которую набирает [9] генеративная музыка, многие относятся к ней со скептицизмом. ML-алгоритмы не разбираются в тонкостях музыкальной теории и не способны [10] заложить в трек чувства и эмоции. В этом контексте нейросети пока не могут заменить композиторов и саунд-продюсеров, но они уже помогают им искать новое звучание. Инженеры из Magenta представили [11] open source синтезатор NSynth Super. Он анализирует кастомные семплы по шестнадцати характеристикам, линейно их интерполирует и формирует новый уникальный звук — например, может объединить [12] звучание ситара [13] и электрического фортепиано [14].

Интеллектуальные инструменты также помогают в продакшене и генерируют клипы. Известно, что видеоряд к треку «Break Free [15]» от американской певицы Тэрин Саузерн был создан в «коллаборации» с системой ИИ.

Еще один момент, в котором нейросети могут быть полезны — это прогнозирование успешности трека. По статистике, всего 10% релизов приносят лейблам прибыль [16]. Возможность предсказать коммерческий успех той или иной работы в прямом смысле означает большие деньги. В этом году группа нидерландских исследователей установила, что прослушивание популярных треков вызывает в нашем мозгу [17] похожие нейронные реакции. Так, алгоритмы машинного обучения могут выделить музыкальные паттерны, вызывающие наиболее активный эмоциональный ответ, и предсказать, насколько новый трек будет интересен аудитории.

«Живые мертвецы» на сцене

На рынке есть синтезаторы [18], позволяющие воспроизвести голоса умерших музыкантов. Вкупе с голографическими технологиями они сумеют «возродить» исполнителей. Так, еще в 2012 году аватар Тупака выступил [19] на одной сцене с Dr. Dre и Снуп Доггом. Хотя о полноценной голограмме тогда речи не шло — видеоряд транслировался на систему зеркал [20], а отражение формировало двумерный «фантом» легендарного исполнителя. Однако перформанс стал отправной точкой для дискуссии о возможности «оживления» других звезд сцены.

Фотография: Eric Ward. Источник: Unsplash.com
Фотография: Eric Ward. Источник: Unsplash.com

В целом голографическим аватарам пророчат светлое будущее. Инженеры из Университета в Сиднее убеждены [21], что в перспективе такие музыканты смогут взаимодействовать с публикой и даже импровизировать. Хотя не до конца понятно, как подходить к таким выступлениям с точки зрения законодательства. Например, в США действует доктрина под названием «право публичности». Она позволяет человеку контролировать, как будет использован его образ (в том числе в коммерческих целях). Но что допустимо после смерти — единого мнения нет [22].

Подобные технологии поднимают [21] и вопросы этики. Некоторые считают, что эксперименты с голограммами — это проявление неуважения к личности исполнителей и их наследию. Так, в 2016 году семья Уитни Хьюстон запретила [23] использовать образ певицы в финале американского The Voice.

Компромиссом в этом вопросе могут стать виртуальные исполнители — без реального прообраза. Их внешность создают иллюстраторы в дизайнерских студиях и озвучивают с помощью семплирования голоса. Примером может быть японская певица Хацунэ Мику. Она дает живые концерты [24], а её треки завоевывают первые позиции в японских чартах. Сегодня тренд на виртуальных исполнителей развивается и на Западе. Так, до конца месяца должно выйти [25] программное обеспечение Solaris для синтеза голоса на английском языке. Не исключено, что в будущем таких необычных перформансов станет больше.


Что почитать по теме в нашем «Мире Hi-Fi»:


Автор: «Мир Hi-Fi»

Источник [29]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/muzy-ka/371312

Ссылки в тексте:

[1] рассказывали: https://habr.com/ru/company/audiomania/blog/594775/

[2] осмысленными текстами и вокалом: https://soundcloud.com/openai_audio/jukebox-86115728

[3] разных жанров: https://towardsdatascience.com/jukebox-by-openai-2f73638b3b73

[4] формируется: https://openai.com/blog/jukebox/

[5] Hello World: https://open.spotify.com/album/0cGWC9bhEJA4l7jAaV7cqR

[6] его назвали: https://www.bbc.com/culture/article/20180112-is-this-the-worlds-first-good-robot-album

[7] Magic Man: https://open.spotify.com/track/4ltuXkmAHmSkHTMIvgmsWp?si=fb2ece144f1449fa

[8] Hello Shadow: https://open.spotify.com/track/5d9c8eqmlIj9WXE4MnlF5n?si=034da3102bd24f08

[9] набирает: https://www.ozy.com/pg/newsletter/the-daily-dose/406405/

[10] не способны: https://www.sciencefocus.com/science/ai-music-future/

[11] представили: https://www.audiomania.ru/content/art-6147.html

[12] объединить: https://youtu.be/0fjopD87pyw

[13] ситара: https://en.wikipedia.org/wiki/Sitar

[14] электрического фортепиано: https://en.wikipedia.org/wiki/Electric_piano

[15] Break Free: https://youtu.be/XUs6CznN8pw

[16] приносят лейблам прибыль: https://imotions.com/blog/the-future-of-music/

[17] мозгу: http://www.braintools.ru

[18] синтезаторы: https://www.wired.com/2011/12/ueki-loid-speech-synthesizer/

[19] выступил: https://youtu.be/TGbrFmPBV0Y

[20] на систему зеркал: https://www.washingtonpost.com/business/technology/how-the-tupac-hologram-works/2012/04/18/gIQA1ZVyQT_story.html

[21] убеждены: https://futurism.com/holograms-resurrecting-dead-musicians

[22] единого мнения нет: https://www.nytimes.com/2016/12/27/movies/how-rogue-one-brought-back-grand-moff-tarkin.html

[23] запретила: https://www.theguardian.com/music/2016/may/20/whitney-houston-hologram-performance-axed-the-voice-christina-aguilera

[24] дает живые концерты: https://www.youtube.com/watch?v=aZlHaC7_eUg

[25] выйти: https://www.musicradar.com/news/solaris-is-a-new-ai-powered-virtual-vocalist-thats-based-on-a-professional-singer

[26] Какие продолжительные и необычные стримы стоит знать: https://www.audiomania.ru/content/art-8660.html

[27] «Хип-хоп импровизации и битвы битов»: какие муз. стартапы стоит знать: https://www.audiomania.ru/content/art-8692.html

[28] Что происходит в сфере аудиочатов и есть ли у них будущее: https://www.audiomania.ru/content/art-8485.html

[29] Источник: https://habr.com/ru/post/645737/?utm_source=habrahabr&utm_medium=rss&utm_campaign=645737