Az OpenAI új PhD-szintű AI termékei
Az AI iparban új buzzword terjed: „PhD-szintű AI.” Az The Information jelentése szerint az OpenAI több speciális AI „ügynök” termék bevezetését tervezi, beleértve egy 20,000 dolláros havi díjú szintet, amely a „PhD-szintű kutatások” támogatására összpontosít. További tervezett ügynökök között szerepel egy „magas jövedelmű tudásmunkás” asszisztens havi 2,000 dolláros áron és egy szoftverfejlesztő ügynök havi 10,000 dolláros díjjal.
Az OpenAI még nem erősítette meg ezeket az árakat, de korábban már említette a PhD-szintű AI képességeit. De mit is jelent pontosan a „PhD-szintű AI”? A kifejezés olyan modellekre utal, amelyek állítólag olyan feladatokat hajtanak végre, amelyek doktori szintű szakértelmet igényelnek. Ezek közé tartoznak az ügynökök, akik fejlett kutatásokat végeznek, bonyolult kódot írnak és hibákat keresnek emberi beavatkozás nélkül, valamint nagy adathalmazokat elemeznek, hogy átfogó jelentéseket készítsenek.
A cégek, mint az OpenAI, a „PhD-szintű” állításaikat specifikus benchmark tesztek teljesítményére alapozzák. Például az OpenAI o1 sorozatú modelljei állítólag jól szerepeltek tudományos, kódolási és matematikai teszteken, eredményeik hasonlóak voltak az emberi PhD hallgatókéhoz a kihívást jelentő feladatokban. A vállalat Deep Research eszköze, amely képes kutatási cikkeket generálni hivatkozásokkal, 26.6%-os eredményt ért el az „Emberség Utolsó Vizsgáján”, amely több mint 3,000 kérdést tartalmazott több mint 100 tantárgyból.
Az o3 modellek fejlődése
Az OpenAI legújabb fejlődése ezen a területen az o3 és o3-mini modellekből származik, amelyeket decemberben jelentettek be. Ezek a modellek az o1 családra épülnek, amelyet tavaly korábban indítottak. Az o3 modellek olyan technikát alkalmaznak, amelyet az OpenAI „privát gondolatláncnak” nevez, egy szimulált érvelési módszer, ahol a modell belső párbeszédet folytat, és iteratívan dolgozik a problémákon, mielőtt végső választ adna.
Ez a megközelítés látszólag tükrözi, ahogyan az emberi kutatók időt töltenek bonyolult problémák megfontolásával, ahelyett, hogy azonnali válaszokat adnának. Az OpenAI szerint minél több időt fektetünk ebbe a következtetési időbe, annál jobb válaszokat kapunk. Tehát itt a lényeg: 20,000 dollárért egy ügyfél valószínűleg rengeteg „gondolkodási időt” vásárol az AI modell számára, hogy nehéz problémákon dolgozzon.
Benchmarks és valós érték
Ideális esetben egy igazi PhD-szintű AI modell lehetséges alkalmazásai közé tartozna orvosi kutatási adatok elemzése, klímamodellezés támogatása és a kutatási munka rutinszerű aspektusainak kezelése. Az The Information által jelentett magas árak, ha pontosak, azt sugallják, hogy az OpenAI úgy véli, ezek a rendszerek jelentős értéket nyújthatnak a vállalkozások számára. A kiadvány megjegyzi, hogy a SoftBank, az OpenAI egyik befektetője, 3 milliárd dollárt tervez költeni az OpenAI ügynök termékeire az idei évben—ami jelentős üzleti érdeklődést jelez a költségek ellenére.
Az OpenAI pénzügyi nyomás alatt áll, ami befolyásolhatja prémium árképzési stratégiáját. A vállalat állítólag körülbelül 5 milliárd dollárt veszített el tavaly az üzemeltetési költségek és más szolgáltatási költségek fedezésére. Az OpenAI 20,000 dolláros árazási tervei a viszonylag megfizethető AI szolgáltatások évei után érkeznek, amelyek arra ösztönözték a felhasználókat, hogy alacsony költségek mellett számítsanak erőteljes képességekre.
Érdekes tény
Az AI modellek, bár erős teljesítményt nyújtanak bizonyos benchmarkokon, továbbra is küzdenek a konfabulációkkal—olyan esetekkel, amikor plauzibilis, de ténylegesen helytelen információt generálnak.
Források
The Information, OpenAI hivatalos közleményei, EpochAI benchmark tesztek.