Егор Летов, поющий песню Меладзе? «Плакала береза» в исполнении Виктора Цоя? Нет, это не фантазии, а реальность, которая стала возможной благодаря автору проекта «Ай, Гитарист!», который с помощью нейросети записывает каверы в исполнении знаменитых рок-музыкантов
Расскажите о себе: как вы связаны с музыкой и как начали экспериментировать с искусственным интеллектом в ней?
— Меня зовут Андрей, я 10 лет работаю в IT, а музыка — это хобби, которое сопровождает меня всю жизнь. Я пою и играю на гитаре с детства, а в юности играл в рок-группах.
Весной 2023 года я узнал, что появилась нейросеть, которая умеет менять голос, и меня это увлекло. В общем, если говорить математически, работа + хобби = проект «Ай, гитарист!».
Как вы работаете над треками?
— Изначально брал песни, которые нравятся мне, потом стал учитывать и мнение подписчиков в комментариях под роликами. Сам процесс происходит так: открываю аккорды, играю песню на гитаре, так сказать, пародируя нужного исполнителя. Если нравится, делаю полноценную аранжировку, пропускаю через нейросеть. На выходе — нейрокавер. Что касается технологий, я использую нейросеть RVC, а модели для нее «тренирую» сам. Главная сложность — изначально с нужными акцентами спародировать исполнителя. Качество нейрокавера зависит именно от этого, а остальное — дело техники.
С какими сложностями приходится сталкиваться?
— Главное – правильная тренировка моделей, то есть обучение нейросети выполнению какой-то задачи. Важно подобрать подходящее число эпох (одна итерация в процессе тренировки нейросети, «прогон» через сеть всех необходимых примеров, необходимых для ее обучения – прим.ред.). Нужно, чтобы их было не слишком много и не слишком мало.
Кстати, а почему вы остановились именно на рок-музыке? Это связано только с хобби?
— В целом, да, хотя я люблю и слушаю самую разную музыку. Например, мне нравятся многие советские эстрадные песни, и нейрокаверы на них есть у меня на канале. Я вообще исхожу из того, что нет плохих песен, а есть плохие аранжировки. Берешь какой-то попсовый хит, меняешь аранжировку, поешь ее голосом Летова, и песня внезапно обретает новый смысл. Магия!
А вообще, рокеров проще «оцифровывать»?
— Нет, модель можно сделать с любого голоса. Тут главное, чтобы исходный материал был качественным: меньше шумов, дефектов записи. Самые простые для оцифровки – треки в акустическом исполнении, где задействовано меньше инструментов.
Вы отдаете предпочтение только русскоязычным нейрокаверам?
— Их большинство, но у меня на канале есть и англоязычные. Например, на песни The Prodigy “Breathe” голосом Фредди Меркьюри.
А конкуренция в сфере создания ИИ-музыки есть?
— Конечно! Но основная доля таких каверов — это просто накладывание моделей на готовые треки. Я же сначала исполняю, записываю и свожу песни сам, а уже потом работаю с нейросетью. Ну и да, я был одним из первых.
У вас есть «любимцы» среди ваших нейрокаверов?
— Выделил бы два трека АйЛетова — «Небо» (оригинальный исполнитель — «Дискотека Авария») и «Ева» (группа «Винтаж»). И один трек АйЦоя — «Дождь» («Черный Лукич»). Я работаю только с теми песнями, которые мне изначально нравятся. Нейрокаверы на них получаются максимально душевными.
Кажется, у зрителей могут быть два полярных мнения — от «вы воскресили моего кумира» до «руки прочь от святыни». Что преобладает?
— В основном люди выражают благодарность и восхищение. Хейта минимум, я стараюсь его не замечать.
Насколько велики риски, связанные с авторскими правами?
— Они есть, точно также как и у музыкантов, которые делают обычные каверы. YouTube уже заблокировал мне один трек после обращения правообладателя (кавер на песню Валерия Меладзе «Салют, Вера!» в исполнении АйЛетова — прим.ред.), поэтому я публикую их и в других соцсетях, например, в телеграм-канале. Понятно, что если жалоба прилетает, трек приходится удалять – либо самостоятельно, либо это сделает площадка. Что ж, приходится мириться с этим и делать следующий нейрокавер. Но это бывает редко.
А вообще трудно работать с YouTube?
— Нет. Выкладываешь клип, а система Content ID определяет, есть ли нарушение авторских прав. В подавляющем большинстве случаев, она их не обнаруживает.
Какие перспективы у ИИ в написании музыки и где здесь этические границы?
— Границы должны быть, да. Для меня недопустимо глумление над творчеством, нужно поступать с музыкой бережно и с уважением. Что касается неизданного, у того же Егора Летова было много стихов, к которым он не написал музыку. Может быть, я в будущем сделаю отдельный плейлист и буду создавать то, что не успели спеть легенды.
А у вас есть «нейрокаверская» мечта?
— Есть. Но я пока не буду ей делиться.
Беседовал Игорь Топорков