Fejlesztés
Bemutatkozik a Sora 2: A jövő videógeneráló modellje
Ma bemutatjuk a Sora 2-t, legújabb videó- és hanggeneráló modellünket. Az előző rendszerhez képest sokkal pontosabb, valósághűbb és irányíthatóbb. Mostantól egy új alkalmazásban, a Sora appban alkothatunk vele.
A korábbi Sora modell februárban debütált, és sok szempontból a videózásban a GPT‑1 pillanata volt. Az első alkalom, amikor a videógenerálás valóban működni kezdett. Az egyszerű viselkedések, mint az objektumok állandósága, a számítási teljesítmény növelésével bukkantak fel. Azóta a Sora csapata a világ szimulációs képességeinek fejlesztésére összpontosított.
Úgy gondoljuk, hogy ezek a rendszerek kulcsfontosságúak lesznek, ha olyan mesterséges intelligencia modelleket akarunk képzni, amelyek mélyen értik a fizikai világot. A legnagyobb mérföldkő ebben a folyamatban a nagyméretű videóadatok előképzése és utóképzése.
A Sora 2 képes olyan dolgokat végrehajtani, amelyek korábban szinte lehetetlenek voltak. Gondoljunk csak a triple axel-re, amelyet egy korcsolyázó hajt végre egy macskával a fején. Igen, jól olvastad! A korábbi modellek hajlamosak voltak túlozni, a valóságot deformálni, hogy teljesítsenek egy szöveges parancsot. De a Sora 2 ügyesebben kezeli a fizikát.
Ez a modell jelentős előrelépést jelent az irányíthatóság terén is. Képes követni az összetett utasításokat, miközben pontosan megőrzi a világ állapotát. Valósághű, filmszerű és anime stílusokban is kiemelkedően teljesít.
Az új alkalmazásban, a Sora-ban, a felhasználók saját magukat is beilleszthetik a generált tartalmakba. Az egyes felhasználóknak lehetőségük van arra, hogy saját videó- és hangfelvételükkel pontosan azonosítsák magukat, majd beugorjanak bármelyik generált jelenetbe. Ez a lehetőség valóban általános, és bármely emberre, állatra vagy tárgyra alkalmazható.
Fontos megemlíteni, hogy a Sora 2 nem tökéletes, sok hibát is elkövet, de ez is egy jelzés arra, hogy a neurális hálózatok videóadatokkal való továbbfejlesztése közelebb visz minket a valóság szimulálásához.
Az alkalmazás elindításával kapcsolatosan a felhasználói élményre is nagy hangsúlyt fektettünk. Az új társadalmi iOS alkalmazás, a Sora, lehetőséget ad arra, hogy a felhasználók felfedezhessék mások generálásait, és remixeljék azokat. A visszajelzések alapján a felhasználók új barátokra találnak a cégen belül is, ami igazán izgalmas!
A biztonsági kérdések is prioritást élveznek számunkra. A fiatalok védelme érdekében alapértelmezett korlátokat állítottunk fel arra vonatkozóan, hogy hány generációt láthatnak naponta. A Sora alkalmazásban a felhasználók irányíthatják, hogy mit látnak, és lehetőségük van módosítani a tartalmakat, amivel a közösségi élmény valóban egyedivé válik.
Tudtad, hogy a mesterséges intelligencia modellek fejlődése nemcsak a technológiai, hanem a társadalmi interakciókat is átformálhatja? A Sora 2 pedig éppen ezt célozza meg!
Források: Sora Team, OpenAI