Szerdán egy videó, amely az OpenAI újonnan indított Sora AI videógenerátorával készült, vírusként terjedt el a közösségi médiában. A felvételen egy tornásznő látható, aki extra végtagokat növeszt, és rövid időre elveszíti a fejét egy olimpiai stílusú talajgyakorlat közben. A videóban tapasztalt nonszensz szintézishibák, amelyeket mi „jabberwockies”-nak hívunk, technikai részletekre utalnak arról, hogyan működnek az AI videógenerátorok, és hogy a jövőben hogyan fejlődhetnek tovább.
De mielőtt mélyebben belemerülnénk a részletekbe, nézzük meg magát a videót. Az AI által generált felvételen egy lehetetlen tornásznő látható, amelyet az OpenAI Sora készített. A videón látható, ahogy a sportoló egy talajgyakorlatot végez. A téma folyamatosan pörög és hadonászik, miközben új lábak és karok gyorsan és folyékonyan jelennek meg és alakulnak át a forgó és transzformáló testéből. Egy pillanatban, körülbelül 9 másodpercnél, elveszíti a fejét, amely aztán spontán módon visszailleszkedik a testéhez.
„Bár a Sora nagyon menő, a torna még mindig a Turing-teszt az AI videók számára” – írta Deedy Das kockázati tőke befektető, amikor megosztotta a videót az X-en. A videó sok reakciót inspirált, például ezt a választ egy hasonló bejegyzésre a Bluesky-n: „Helló, tornaszakértő vagyok! Ez nem vicces, a tornászok csak akkor csinálnak ilyet, amikor rendkívüli distresszben vannak.”
Kapcsolatba léptünk Dassal, aki megerősítette, hogy a videót a Sora segítségével generálta. Emellett megosztotta a promptot is, amely nagyon hosszú volt és négy részre bontva készült, komplex utasításokkal, mint például: „A tornásznő a hátsó jobb sarokból indul, jobboldali lábával B-plusz állásban helyezkedik el.”
„Tudtam már 6 hónapja, hogy a szövegből videóvá alakító modellek nehezen boldogulnak a komplex fizikai mozgásokkal, mint például a torna,” mondta Das egy beszélgetés során. „Meg kellett próbálnom [a Sorát], mert a karakterkonzisztencia javulni tűnt. Összességében ez egy fejlődés volt, mert korábban… a tornásznő egyszerűen teleportált vagy ruhát váltott közben, de összességében még mindig eléggé hátborzongatóan néz ki. Reméltük, hogy az AI videók alapértelmezés szerint megtanulják a fizikát, de ez még nem történt meg!”
Érdekes tény: Az AI videógenerátorok fejlődése során a kutatók megfigyelték, hogy a modellek képesek voltak kreatívan új formákat és mozgásokat létrehozni, de a fizikai törvények érvényesítése még mindig kihívást jelent számukra.
Források: OpenAI, Deedy Das, Bluesky