Az AI ipar mindent megtesz, hogy a „ügynökök” – az AI vezérelt szoftverek, amelyek több lépéses cselekvéseket hajtanak végre a felhasználók nevében – valósággá váljanak. Számos tech vállalat, köztük a Google, nemrégiben hangsúlyozta az ügynöki funkciókat, és januárban Sam Altman, az OpenAI vezérigazgatója azt írta, hogy 2025 lesz az az év, amikor az AI ügynökök „csatlakoznak a munkaerőhöz”.
Az OpenAI azon dolgozik, hogy ezt az ígéretet valósággá formálja. Kedden bemutatták az új „Responses API”-t, amelyet arra terveztek, hogy segítse a szoftverfejlesztőket AI ügynökök létrehozásában, amelyek önállóan tudnak feladatokat végrehajtani a vállalat AI modelljeivel. A Responses API végül felváltja a jelenlegi Assistants API-t, amelyet az OpenAI 2026 első felében tervez nyugdíjazni.
Az új lehetőséggel a felhasználók olyan egyedi AI ügynököket fejleszthetnek, amelyek vállalati fájlokat keresnek egy gyors fájlkereső eszközzel, amely gyorsan ellenőrzi a vállalati adatbázisokat (az OpenAI ígéri, hogy nem képezi ki a modelljeit ezekből a fájlokból) és weboldalakat navigálnak – hasonlóan az OpenAI Operator ügynök által elérhető funkciókhoz, amelynek alapját képező Számítógép-Használó Ügynök (CUA) modellt a fejlesztők is elérhetik, lehetővé téve ezzel feladatok automatizálását, mint például adatbevitel és más műveletek.
Az OpenAI azonban elismeri, hogy a CUA modellje még nem megbízható az operációs rendszereken való feladatok automatizálására, és tévedéseket is okozhat. A cég az új API-t korai iterációnak nevezi, amelyet folyamatosan fejleszteni fognak az idő múlásával.
Azok a fejlesztők, akik a Responses API-t használják, hozzáférhetnek azokhoz a modellekhez, amelyek a ChatGPT Search-t működtetik: GPT-4o search és GPT-4o mini search. Ezek a modellek képesek böngészni a weben, hogy válaszokat adjanak kérdésekre és hivatkozzanak forrásokra a válaszaikban. Ez figyelemre méltó, mert az OpenAI szerint a hozzáadott webes keresési képesség drámaian javítja az AI modellek ténybeli pontosságát.
Az OpenAI SimpleQA benchmarkján, amely a konfabulációs arány mérésére irányul, a GPT-4o search 90%-os, míg a GPT-4o mini search 88%-os eredményt ért el – mindkettő lényegesen felülmúlta a nagyobb GPT-4.5 modellt, amely keresés nélkül 63%-ot ért el. A technológia azonban még mindig jelentős korlátokkal küzd. A CUA weboldalak megfelelő navigálásával kapcsolatos problémák mellett a javított keresési képesség sem oldja meg teljesen az AI konfabulációk problémáját, mivel a GPT-4o search még mindig 10%-os tévedési arányt mutat.
A Responses API mellett az OpenAI kiadta az open source Agents SDK-t, amely ingyenes eszközöket biztosít a fejlesztőknek, hogy integrálják a modelleket belső rendszerekkel, védelmet valósítsanak meg, és figyelemmel kísérjék az ügynökök tevékenységét. Ez az eszközkészlet követi az OpenAI korábbi Swarm kiadását, amely több ügynök irányítására szolgáló keretrendszert biztosít.
Még mindig korai napok vannak az AI ügynökök területén, és a fejlődés valószínűleg gyorsan fog haladni. Azonban jelenleg az AI ügynök mozgalom továbbra is sebezhető a valóságtól elrugaszkodott állításokkal szemben, amit a közelmúltban tapasztaltak, amikor a felhasználók felfedezték, hogy a kínai startup, a Butterfly Effect Manus AI ügynökplatformja sok ígéretét nem tudta teljesíteni, kiemelve a promóciós állítások és a gyakorlati funkciók közötti állandó szakadékot ebben az új technológiai kategóriában.
Érdekesség: A mesterséges intelligencia képes arra, hogy 2025-re akár 85%-ban automatizálja a munkahelyi feladatokat egyes iparágakban!
Források: OpenAI hírek, TechCrunch, Wired