- PVSM.RU - https://www.pvsm.ru -
Записать песню на удаленке уже не проблема — мы рассказывали [1] об инструментах, которые позволяют сделать это. Так, фронтмен британской рок-группы Oasis ни разу не встречался с басистом, участвовавшим в записи альбома Who Built The Moon?
Мы решили продолжить тему, немного повизионерствовать и обсудить технологии, которые изменят (и уже меняют) подходы к написанию и исполнению музыки.

Такие алгоритмы машинного обучения разрабатывают специалисты в корпорациях и исследовательских лабораториях. Инженеры из OpenAI представили инструмент Jukebox, способный генерировать песни с осмысленными текстами и вокалом [2]. Нейросеть обучили на датасете из миллионов композиций разных жанров [3]: от регги и кантри до рока и хип-хопа. ML-модель использует вариационный автокодировщик VQ-VAE. Он сжимает аудио, сохраняя акустическую информацию о громкости, тембре и высоте звука. На основе этих данных формируется [4] новая аудиодорожка.
Другой пример — альбом Hello World [5] от композитора SKYGGE. Он целиком записан с помощью нейросетей. На BBC его назвали [6] первым действительно хорошим альбомом от робота. При этом два самых популярных трека — «Magic Man [7]» и «Hello Shadow [8]» — в сумме собрали почти 10 млн прослушиваний на Spotify.
Несмотря на популярность, которую набирает [9] генеративная музыка, многие относятся к ней со скептицизмом. ML-алгоритмы не разбираются в тонкостях музыкальной теории и не способны [10] заложить в трек чувства и эмоции. В этом контексте нейросети пока не могут заменить композиторов и саунд-продюсеров, но они уже помогают им искать новое звучание. Инженеры из Magenta представили [11] open source синтезатор NSynth Super. Он анализирует кастомные семплы по шестнадцати характеристикам, линейно их интерполирует и формирует новый уникальный звук — например, может объединить [12] звучание ситара [13] и электрического фортепиано [14].
Интеллектуальные инструменты также помогают в продакшене и генерируют клипы. Известно, что видеоряд к треку «Break Free [15]» от американской певицы Тэрин Саузерн был создан в «коллаборации» с системой ИИ.
Еще один момент, в котором нейросети могут быть полезны — это прогнозирование успешности трека. По статистике, всего 10% релизов приносят лейблам прибыль [16]. Возможность предсказать коммерческий успех той или иной работы в прямом смысле означает большие деньги. В этом году группа нидерландских исследователей установила, что прослушивание популярных треков вызывает в нашем похожие нейронные реакции. Так, алгоритмы машинного обучения могут выделить музыкальные паттерны, вызывающие наиболее активный эмоциональный ответ, и предсказать, насколько новый трек будет интересен аудитории.
На рынке есть синтезаторы [18], позволяющие воспроизвести голоса умерших музыкантов. Вкупе с голографическими технологиями они сумеют «возродить» исполнителей. Так, еще в 2012 году аватар Тупака выступил [19] на одной сцене с Dr. Dre и Снуп Доггом. Хотя о полноценной голограмме тогда речи не шло — видеоряд транслировался на систему зеркал [20], а отражение формировало двумерный «фантом» легендарного исполнителя. Однако перформанс стал отправной точкой для дискуссии о возможности «оживления» других звезд сцены.

В целом голографическим аватарам пророчат светлое будущее. Инженеры из Университета в Сиднее убеждены [21], что в перспективе такие музыканты смогут взаимодействовать с публикой и даже импровизировать. Хотя не до конца понятно, как подходить к таким выступлениям с точки зрения законодательства. Например, в США действует доктрина под названием «право публичности». Она позволяет человеку контролировать, как будет использован его образ (в том числе в коммерческих целях). Но что допустимо после смерти — единого мнения нет [22].
Подобные технологии поднимают [21] и вопросы этики. Некоторые считают, что эксперименты с голограммами — это проявление неуважения к личности исполнителей и их наследию. Так, в 2016 году семья Уитни Хьюстон запретила [23] использовать образ певицы в финале американского The Voice.
Компромиссом в этом вопросе могут стать виртуальные исполнители — без реального прообраза. Их внешность создают иллюстраторы в дизайнерских студиях и озвучивают с помощью семплирования голоса. Примером может быть японская певица Хацунэ Мику. Она дает живые концерты [24], а её треки завоевывают первые позиции в японских чартах. Сегодня тренд на виртуальных исполнителей развивается и на Западе. Так, до конца месяца должно выйти [25] программное обеспечение Solaris для синтеза голоса на английском языке. Не исключено, что в будущем таких необычных перформансов станет больше.
Что почитать по теме в нашем «Мире Hi-Fi»:
«Хип-хоп импровизации и битвы битов»: какие муз. стартапы стоит знать [27]
Что происходит в сфере аудиочатов и есть ли у них будущее [28]
Автор: «Мир Hi-Fi»
Источник [29]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/muzy-ka/371312
Ссылки в тексте:
[1] рассказывали: https://habr.com/ru/company/audiomania/blog/594775/
[2] осмысленными текстами и вокалом: https://soundcloud.com/openai_audio/jukebox-86115728
[3] разных жанров: https://towardsdatascience.com/jukebox-by-openai-2f73638b3b73
[4] формируется: https://openai.com/blog/jukebox/
[5] Hello World: https://open.spotify.com/album/0cGWC9bhEJA4l7jAaV7cqR
[6] его назвали: https://www.bbc.com/culture/article/20180112-is-this-the-worlds-first-good-robot-album
[7] Magic Man: https://open.spotify.com/track/4ltuXkmAHmSkHTMIvgmsWp?si=fb2ece144f1449fa
[8] Hello Shadow: https://open.spotify.com/track/5d9c8eqmlIj9WXE4MnlF5n?si=034da3102bd24f08
[9] набирает: https://www.ozy.com/pg/newsletter/the-daily-dose/406405/
[10] не способны: https://www.sciencefocus.com/science/ai-music-future/
[11] представили: https://www.audiomania.ru/content/art-6147.html
[12] объединить: https://youtu.be/0fjopD87pyw
[13] ситара: https://en.wikipedia.org/wiki/Sitar
[14] электрического фортепиано: https://en.wikipedia.org/wiki/Electric_piano
[15] Break Free: https://youtu.be/XUs6CznN8pw
[16] приносят лейблам прибыль: https://imotions.com/blog/the-future-of-music/
[17] мозгу: http://www.braintools.ru
[18] синтезаторы: https://www.wired.com/2011/12/ueki-loid-speech-synthesizer/
[19] выступил: https://youtu.be/TGbrFmPBV0Y
[20] на систему зеркал: https://www.washingtonpost.com/business/technology/how-the-tupac-hologram-works/2012/04/18/gIQA1ZVyQT_story.html
[21] убеждены: https://futurism.com/holograms-resurrecting-dead-musicians
[22] единого мнения нет: https://www.nytimes.com/2016/12/27/movies/how-rogue-one-brought-back-grand-moff-tarkin.html
[23] запретила: https://www.theguardian.com/music/2016/may/20/whitney-houston-hologram-performance-axed-the-voice-christina-aguilera
[24] дает живые концерты: https://www.youtube.com/watch?v=aZlHaC7_eUg
[25] выйти: https://www.musicradar.com/news/solaris-is-a-new-ai-powered-virtual-vocalist-thats-based-on-a-professional-singer
[26] Какие продолжительные и необычные стримы стоит знать: https://www.audiomania.ru/content/art-8660.html
[27] «Хип-хоп импровизации и битвы битов»: какие муз. стартапы стоит знать: https://www.audiomania.ru/content/art-8692.html
[28] Что происходит в сфере аудиочатов и есть ли у них будущее: https://www.audiomania.ru/content/art-8485.html
[29] Источник: https://habr.com/ru/post/645737/?utm_source=habrahabr&utm_medium=rss&utm_campaign=645737
Нажмите здесь для печати.