Изкуственият интелект като поп музикален изпълнител

Мария Иванова Последна промяна на 26 ноември 2022 в 12:16 2793 0

Снимка Holly+

Роботакси мина на червено в САЩ, но пътната полиция нямаше как да му връчи фиш

08/09/2025

Квантовите компютри може да се появят по-рано от очакваното

През последните години технологии като Изкуствен интелект (AI), виртуална (VR) и добавена (AR) реалност постепенно започнаха да навлизат в света на креативните изкуства като рисуване, фотография, графичен дизайн и др.

Изкуственият интелект показа потенциала си в областта на изображенията с успеха на софтуера DALL-E. Но AI вече навлиза и в нова територия - тази на музиката. Изпълнители от различни музикални жанрове го използват в проектите си. Появиха се дори опасения, че машините могат да отнемат работните места на част от заетите в музикалната индустрия хора.

Holly+ или певецът AI

Най-пресният пример за това е от миналата седмица. Той идва от експерименталната композиторка Холи Херндън, която се занимава с машинно обучение и разработва собствена музикална невронна мрежа, наречена Spawn. Най-новият ѝ сингъл представлява кавър на популярната кънтри класика „Jolene“ на Доли Партън, вокалите в който са изпълнени изцяло от изкуствен интелект (неин дигитален двойник). За да го направи, тя записва как говори и пее в продължение на часове. От тези записи изкуственият интелект се научава да синтезира вокалния ѝ тембър.

Можем да кажем, че подходът на Херндън, която успява посредством машинно обучение да постигне убедителна AI имитация на гласа си, е уникален. Защото много артисти са използвали изкуствен интелект, за да генерират музика, но малцина за генерирането на вокали.

Всичко това се случва с помощта на създадената от Холи Херндън система, наречена Holly+. Тя може да преобразува въведен текст или качено аудио в гласа на изпълнителката. Това е първият персонализиран гласов инструмент, който позволява на потребителите да качат свое аудио изпълнение (с продължителност до 5 минути), което след това да изтеглят под формата на музика, изпълнявана от изкуствения интелект и дори да го използват в свои проекти.

Кавърът „Jolene“ с гласа на Холи Херндън и в изпълнение на дигиталната ѝ двойничка беше пуснат, заедно с нов музикален видеоклип, режисиран от дигиталния артист Сам Ролфс. За създаването му е използва технология за улавяне на движението, чрез която е генериран 3D аватар на Херндън.

Само за първите пет дни от качването ѝ в Youtube песента събира над 77 хиляди показвания. Тя обаче разделя музикалните фенове на две групи. Според една част от публиката кавърът звучи доста чисто и убедително, въпреки че му липсват някои от нюансите и емоцията на човешки глас. Други обаче смятат, че фразите са накъсани, с твърде дълги вдишвания и случайни цифрови артефакти между отделните стихове. Някои критици дори определят AI изпълнителката Холи+ като страховита. Поддръжниците обаче споделят, че ако не са знаели, че слушат AI от самото начало, вероятно са щели да се заблудят.

Други системи за генериране на глас чрез AI

През последните години вниманието привлякоха още два проекта за генериране на глас с помощта на изкуствен интелект - Wavenet и Tacotron. Wavenet е невронна мрежа за генериране на аудио, създадена от дъщерното дружество за изкуствен интелект на Alphabet - DeepMind. Чрез нея може да се моделира както човешка реч, така и музика. Tacotron е разработка на технологичния гигант Google, чрез която отново с помощта на AI може да се преобразува текст в глас, който трудно може да бъде различен от човешкия.

И ако вече свикнахме с генерираните от AI снимки и видеоклипове, то създадените с помощта на изкуствен интелект музикални вокали тепърва се разгръщат. Технологията в областта напредва с бързи темпове. А създателите ѝ прогнозират, че вероятно скоро генерирането на глас ще се превърне в стандартна практика за артисти и други творци. Ето и още няколко примера:

Новите хитове

Нашумялата напоследък компания за разработка на изкуствен интелект OpenAI (създател и на споменатия по-горе изкуствен интелект за рисуване DALL-E) беше една от първите, които демонстрираха възможностите на изкуствения интелект в музиката. Създадената от нея невронна мрежа, наречена Jukebox, може не само да комбинира различни жанрове, а дори да интерпретира песен на един творец в стила на друг. По този начин става възможно например да чуем как Франк Синатра пее Toxic на Бритни Спиърс, което е много забавно.

Благодарение на Изкуствения интелект се появи и нова песен на NIRVANA. Тя е създадена с програмата Magenta на Google, като в нея са вкарани midi файлове с всички песни на групата. Софтуерът ги анализира и на тази база прави "новата" композиция, наречена “Drowned In The Sun”. Вокалите в песента обаче са истински - на Ерик Хоугън от трибют групата 'Nevermind: The Ultimate Tribute To Nirvana'.

Припомняме, че през лятото виртуалният рапър FN Meka влезе в историята като „първият в света AR изпълнител“, подписал договор с голяма звукозаписна компания. По-късно обаче Capitol Records „прекъсна връзките“ си с него заради обвинения в расизъм. За този проект се твърди, че музиката и текстовете са генерирани от AI, използвайки данни, събрани от видео игри и социални мрежи.

Рапър с машинно обучение

Преди броени дни музикалният стартъп Splash, представи най-новия си проект, в който изкуственият интелект може не само да пее, а и да рапира като американския хип хоп изпълнител Кендрик Ламар. При този проект на базата на текст и темпо, AI създава кавър на песента „N95“ на популярния рапър. Миналата седмица рапърът изненада феновете си с нов deepfake (генериран от изкуствен интелект видеоклип), в който се превъплъщава в образите на O.J. Симпсън, Уил Смит, Кание Уест и други популярни личности.

Видяхме как най-новият експеримент на Херндън в областта на изкуствения интелект може да вземе един звук и чрез AI да го превърне в друг. Вече знаем, че невронната мрежа на OpenAI - Jukebox е способна да имитира гласовете на Бритни Спиърс, Елвис Пресли, Кейти Пери и др. Всички тези примери показват, че човекът вече може да обучи машините да композират, свирят и пеят доста добре.

Но означава ли това, че трябва и възможно ли е изкуственият интелект да ни отнеме удоволствието от музиката? Вероятно точно както интернет необратимо промени начина, по който всички ние консумираме музика, така AI ще промени начина, по който музикантите я създават.

Т.нар. вокални модели, в комбинация с технологията за машинно обучение, вече правят възможно клонирането на човешкия глас с цел генериране на музика. Това развитие обаче повдига нови въпроси, свързани със собствеността върху гласа.

Според самата Холи Херндън това е начинът “артистите да поемат контрола върху дигиталното си аз“. “Вокалните дълбоки фалшификати са тук, за да останат“ - заявява тя на своя уебсайт, уточнявайки, че трябва да се намери баланс между защитата на артистите и насърчаването им да експериментират с тази “нова и вълнуваща технология”.