A Meta forradalmi „Movie Gen” AI rendszere: Egyetlen fényképből készít mélyhamisított videót! Fedezd fel a jövő technológiáját!

2023. október 20-án a Meta bemutatta a Movie Gen nevű új AI modellsorozatát, amely videók, audiók és képek létrehozására és manipulálására szolgál. A cég állítása szerint ezek a modellek felülmúlják más videószintézis modellek teljesítményét, amikor az emberek értékelik őket, közelítve minket ahhoz a jövőhöz, ahol bárki képes lesz bármilyen témáról teljes videót szintetizálni.

A Meta nem közölt konkrét terveket arra vonatkozóan, mikor és hogyan fogják ezeket a képességeket a nagyközönség számára elérhetővé tenni, de a cég hangsúlyozta, hogy a Movie Gen eszköz lehet az emberek kreativitásának fokozására, nem pedig a humán művészek és animátorok helyettesítésére. A jövőbeli alkalmazások között szerepelhet például a közösségi média platformok számára könnyen létrehozható és szerkeszthető „egy nap az életben” videók készítése, vagy személyre szabott animált születésnapi üdvözletek generálása.

A Movie Gen technikai részletei

A Movie Gen a Meta korábbi videószintézissel kapcsolatos munkájára épít, követve a 2022-es Make-A-Scene videógenerátort és az Emu képszintézis modellt. Ez az új rendszer, amely szöveges utasításokat használ irányításként, először képes saját hangokkal rendelkező egyedi videók generálására, meglévő videók szerkesztésére és változtatások beillesztésére, valamint az emberek képeinek valósághű, személyre szabott videókká alakítására.

A Movie Gen videógeneráló modell 1080p felbontású, akár 16 másodperces HD videókat képes létrehozni, 16 képkocka másodpercenként, szöveges leírások vagy képes bemenet alapján. A Meta azt állítja, hogy a modell képes kezelni a bonyolult fogalmakat, mint például az objektumok mozgása, a téma-objektum interakciók és a kameramozgások.

Versenytársak a piacon

A Meta nem az egyetlen szereplő az AI videószintézis területén. A Google májusban bemutatta a Veo nevű új modellt, és a Meta állítása szerint a Movie Gen kimenetei az emberi preferencia teszteken felülmúlták az OpenAI Sora, a Runway Gen-3 és a kínai videómodell, a Kling teljesítményét. Az AI által generált videók megjelenítése új szintre emeli a kreatív tartalom előállítást.

Érdemes megjegyezni, hogy a Movie Gen képes a koherens jelenetek generálására, azonban a sikeressége valószínűleg függ attól, hogy milyen példákon alapult a modell képzése. A video-generátorokból származó kiragadott eredmények gyakran drámaian eltérnek a tipikus eredményektől, és a koherens végeredmény eléréséhez sok kísérletre és hibára lehet szükség.

Érdekes tény: Az AI által generált tartalmak irányítása és finomítása során a felhasználók az inputok személyre szabásával és a rendszer tanulmányozásával egyre kreatívabb és egyedi tartalmakat hozhatnak létre.

Források: Meta, TechCrunch, Wired