Az új „etikus” AI zeneszerző még egy félig tisztességes dalt sem tud írni


Jen: Az „Etikusan Képzett” AI Zenei Generátor

Amikor a „etikusan képzett” mesterséges intelligencia által vezérelt zenei generátor, Jen, néhány hete elindult, elég kedvező időpontban történt: Az Amerikai Hanglemezgyártók Szövetsége éppen beperelte az Udio és Suno programokat szerzői jogok megsértése miatt, azt állítva, hogy a programokat szerzői joggal védett anyagokon képezték ki a készítők engedélye nélkül. Ezzel szemben Jen azt állította, hogy több mint 40 képzési katalógust licencelt, és megígérte, hogy mindent ellenőriz, ami a rendszerébe kerül és onnan kijön, hogy biztosan ne sértse meg a szerzői jogokat. Míg más AI zenei generátorok kevésbé hízelgő címlapokra kerültek, Jen alternatívaként pozícionálta magát.

Az etikai kérdéseket félretéve, az, hogy Jen által generált zene megállja-e a helyét, vitatható. A program által generált számoknak nincsenek szövegei, és bár AI-ja licencelt anyagokon lett kiképezve – a lista, amelyet még nem hoztak nyilvánosságra – nem tűnik olyasminek, amit a rádióban hallhatnánk. Nem kérheted Jent, hogy készítsen egy Willie Nelson dalt, mert valójában nem tudja, hogyan hangzik Willie Nelson. (Próbálkozásunk valami olyasmit eredményezett, ami inkább trip-hopnak hangzott.) Még akkor is, ha Nelson helyett „outlaw country”-t kérsz, amely zsáner már fél évszázada létezik és számtalan mérföldkő albumot befolyásolt, csak valami közömbösen „country” zenét kapsz, inkább könnyű hallgatást mint honky-tonkot.

Képillusztráció: WIRED Staff; Getty Images

A mélyebb kutatáshoz a WIRED öt profi zenészt kért fel Jen képességeinek tesztelésére: John Heywood, basszusgitáros, aki leginkább az indie rock act Alex G támogatásáról ismert; Wye Oak és Flock of Dimes Jenn Wasner; Shana Cleveland, a surf-noir act La Luz alapítója; Steve Reidell, a The Hood Internet és Air Credits tagja; és Allen Blickle, kétszeres Emmy-jelölt zeneszerző és hangtervező, aki többek között a Netflix, Disney és Apple Music projektjein dolgozott. Mind az öt zenész találta a programot könnyen használhatónak, de alapvetően inspirálatlannak.

Wasner, aki nyitott az AI gondolatára, mint „ötletek generálásának eszközére”, már látott AI programokat a stúdióban vagy egy zenekar írási folyamatában használni. Az idejében, amit Jennek szentelt, azonban küzdött, hogy bármit is létrehozzon, amit szívébe zárhatna. „Minden, amit készített, olyan volt, mintha egy furcsa völgy szituációból jött volna, és bár lenyűgöző volt hallgatni, mindez csak egy trükknek tűnt, mint ‘Ó, trap high hat-eket tehetek egy bluegrass számra,'” magyarázza. „Soha nem volt olyan pont, amikor azt gondoltam volna, hogy ‘Ez egy klassz ötlet.’ Mindig azt gondoltam, hogy ‘Ezt magam is jobban kitalálhattam volna.'”

A Jen Music AI jóvoltából

Elismerem, hogy tesztelő művészeink túlmentek azon, amit egy „normális” ember kérhetne egy lekérdezésben, inkább egy „lemezbolt eladó” szintjére hajolva a felvett hangok ismeretével. Cleveland például nem tudott semmi jót kihozni egy „közepes tempójú kaliforniai garázsrock, amelyet ’70-es évek indonéz popja befolyásolt” lekérdezésből, míg Heywood csalódottságát fejezte ki amiatt, hogy Jen nem ismerte fel a „city pop” kérést, egy japán zenei típust, amely a ’70-es évek közepén vált népszerűvé, és az utóbbi években kisebb reneszánszát élte. De Heywood szerint az ilyen zenei szélesség szükséges, különösen zenészként.

„Sok zenész vagy producer, amikor kér valamit egymástól, zenekarokat és más művészeket használnak referenciapontként, például ‘Prince-féle hangzásra megyünk,’ vagy ‘Tegyük hozzá Clavinet-et, mint Stevie Wonder,'” magyarázza Heywood. Jen létező felvett művészek és még néhány meglehetősen gyakori zsáner és hangszer megértésének hiányával nehéz igazán valami specifikusra rátalálni.

„Folyamatosan próbáltam valami melegséget kicsikarni belőle, mint vinil zizegés vagy telítettség, vagy valami lo-fi vagy vintage hangzású, de minden, amit készített, ugyanolyan fajta hi-fi, videojáték-menü-képernyő-szerű hangzása volt,” mondja Heywood. „Még ‘lo-fi’-t is adnak javaslatként, de úgy tűnt, ez nem tett túl nagy hatást. Ha egy bizonyos hangzást próbálsz elérni, mint például ’80-as évek funk, a legközelebb amit elérhetsz, valami, ami inkább Daft Punknak hangzik.”

Minden elektromos gitár hang, amit a WIRED és a tesztelők generáltak, szinte túl tiszta volt, és szinte lehetetlen volt olyan számot létrehozni, amely nem 4/4 ütemmutatóban van, hacsak nem használtad a „keringő” szót a lekérdezésben.

Ebből, mondja Jen társalapítója Shara Senderoff, néhány dolog várható volt. Az eszköz alfa fázisban van, és a 10 másodperces és 45 másodperces számok, amelyeket generál, „inspirálni és kiindulópontot biztosítani a kreativitás számára, nem feltétlenül végterméknek szánják,” mondja. Új képességek érkeznek, és mivel Jen korlátozott adatbázison lett kiképezve, van helye a növekedésnek és „jelentősen bővülni fog a béta fázisban,” teszi hozzá Senderoff.

Minden, amit Jen rockzene álcája alatt készített, Heywood szerint olyan volt, mint a „clip art verzió” a zsánerből. Cleveland képes volt kiváltani néhány számot, amelyek „úgy hangzottak, mintha autóreklámban használhatók lennének” vagy amelyek „kezdenek a Black Keys területére lépni,” de inkább úgy érezte, hogy Jen minden zenei javaslata csak egyszerűen gagyi volt.

„Olyan volt, mint a fajta zene, amit készítenék, ha a barátaimmal szórakoznánk, viccelődve más zsánerek kliséiről,” mondja. „El tudtam képzelni néhány számot egy szuper rossz Netflix randi show-ban, de semmi, amit készítettem, nem tűnt személyesen fenyegetőnek.”

De mi a helyzet mindazokkal, akik a Netflix randi show-ban hallható számokat készítik? Jen fenyegetést jelenthet az ő munkájukra? Blickle szerint szinte biztosan.

„Ha egy producer vagy kis költségvetéssel, és csak a tartalmat akarod kiadni, most mondhatod, hogy ‘Még csak nem is fizetek tervezőnek vagy animátornak. Csak használhatok egy képgenerátort,'” mondja. „Ugyanez igaz a zenei költségvetésre. Ha semmit nem kell fizetni valamiért, ami 2000 dollárba került volna, akkor nagyszerű, valaki azt fogja gondolni, hogy 2000 dollár a zsebükben van.”

Az olyan alkalmazások, mint Jen, még nem adnak alkotóknak lehetőséget a crescendo pontok beállítására vagy a stingers hozzáadására a számokhoz, amelyek készen állnak a hangszerelésre, de csak várható, hogy ez is a láthatáron van.

Blickle szerint a stock zenei könyvtárak, amelyeket sok alacsony költségvetésű produkció és valóságshow használ a termékeik hangszerelésére, látni fogják a Jenhez hasonló forrásokból származó anyagok beáramlását. Míg a könyvtárakban lévő anyagok nagy részét „szemétnek” nevezi, azt mondja, hogy „ha ilyen típusú zenét keresel, csak több lesz belőle. Ez egy visszacsatolási hurkot fog létrehozni a rossz könyvtári zenéből, és nem látom, hogyan javítaná bárki életének élvezetét.”

Az AI által létrehozott zenei roham szintén problémákat okozhat azoknak a produkcióknak, amelyek AI zenét használnak. Míg az olyan oldalak, mint a YouTube és az Instagram lehetővé teszik az AI által generált számok közzétételét, mivel elvileg a „új” szám tulajdonosa lennél, az AI által generált tartalomra vonatkozó törvények világszerte változnak, ami azt jelenti, hogy ha egy TV-műsort más piacokra akarsz eladni, érdemes óvatosnak lenned a zene létrehozásával kapcsolatban – még akkor is, ha egy „etikus” forrásból, mint Jen származik. Az Egyesült Államok törvényei szintén előírják, hogy minden szerzői jogi védelmet kereső munkának emberi szerzője kell, hogy legyen.

Huszonöt évvel a Napster után mind az öt művész azt mondta, hogy az olyan zenei generátorok lehetősége, mint Jen – etikusan forrásból vagy sem – tönkreteheti megélhetésüket, csak elkerülhetetlennek tűnt. „Olyan kevés mód maradt, hogy a zenészek pénzt keressenek azzal, amit csinálnak, és egy újabb módszer elvesztése és kikezdése határozottan nyugtalanító. De olyan helyzetben vagyok, hogy úgy érzem, már meggyászoltam ezt a veszteséget,” mondja Wasner. „Csak ki kell találnunk valamit.”

Érdekes tény: A mesterséges intelligencia által generált zene egyre nagyobb figyelmet kap, és az AI-képesített eszközök, mint például a Google AI, már képesek elbűvölő zenéket létrehozni, amelyek elérik a hagyományos emberi zenészek színvonalát.

Források: WIRED, Amerikai Hanglemezgyártók Szövetsége, Google AI