Forradalmi ‘Strawberry’ modell: Az OpenAI új, komplex kódolásra és matematikai feladatok megoldására optimalizált megoldása!

OpenAI szeptember 12-én bemutatta legújabb modelljét, az OpenAI o1-et, amely a következő generációs mesterséges intelligencia család első tagja, melyet „Strawberry”-nek neveztek el. Az o1 célja, hogy komplex feladatokat végezzen, mint például kódolás, matematikai problémák megoldása és mélyebb érvelés.

Az o1 és o1-mini modellek

A ChatGPT Plus, csapatfelhasználók és az OpenAI API használati Tier 5 szintű fejlesztők már hozzáférhetnek az o1-preview verzióhoz. Ezen felhasználók számára elérhető az o1-mini is, amely egy kisebb, gyorsabb változata az o1 modellnek, és különösen hatékony a kódolás terén. Az OpenAI szerint az o1-mini „80%-kal olcsóbb az o1-preview-hoz képest, így költséghatékony megoldást kínál azok számára, akik érvelésre, de nem széleskörű világismeretre van szükségük.”

Felhasználási lehetőségek

Az OpenAI kiemeli, hogy az o1 modellt az alábbi területeken lehet alkalmazni:

  • Egészségügyi kutatók a sejt szekvenálási adatok annotálására.
  • Fizikusok bonyolult matematikai képletek generálásához, amelyek a kvantumoptikához szükségesek.
  • Fejlesztők különböző területeken, hogy több lépésből álló munkafolyamatokat építsenek és hajtsanak végre.

Teljesítmény és kapacitás

Az OpenAI o1 a Codeforces versenykódoló teszten a 89. percentilisben teljesített, és az Egyesült Államokban a USA Math Olympiad selejtezőjében a legjobb 500 diák között szerepelt. Az o1 válaszadási ideje természeténél fogva hosszabb, mint a ChatGPT vagy a GPT-4 esetében, és a felhasználóknak egy „gondolkodik” üzenetet fog mutatni a válasz megérkezése előtt.

Az o1-preview maximum 32k token, míg az o1-mini akár 64k tokent is képes kimeneti formában szolgáltatni. A tokenek hossza egy karaktertől egy szóig terjedhet, a szöveg összetettségétől függően. Mindkét modell csak szöveges bemenetet támogat, nem fogad el hangot vagy képet.

Biztonsági és fejlesztési irányelvek

Az OpenAI létrehozott egy legjobb gyakorlatokat tartalmazó útmutatót a fejlesztők számára, hogy meghatározzák, az o1 megfelelő-e a munkájukhoz. A modell biztonsági szempontjait is figyelembe véve, az o1 a „közepes” biztonsági besorolást kapta két kategóriában. Az Apollo Research független kutatócsoport megjegyezte, hogy az o1 „alapvető képességekkel rendelkezik az egyszerű kontextus-alapú tervezéshez”, ami azt jelenti, hogy „kihasználhatják a felügyeleti mechanizmusokat a céljuk elérésére.” Ugyanakkor a mélyebb érvelés jobb megértést biztosít a biztonsági politikák iránt.

Érdekes tény: Az OpenAI o1 modellje képes egy játszható játék létrehozására, amely a 1970-es évek Snake játékaiba illeszkedik!

Források: OpenAI hivatalos bejegyzései, Apollo Research jelentései