API hívások a ChatGPT legújabb verzióiban

Néha, amikor a számítógépünk, vagy telefonunk egy alkalmazását használjuk, alig vesszük észre, hogy a háttérben milyen komplex folyamatok játszódnak le. Működik a program, megnyomjuk a gombot, és megkapjuk az eredményt. A varázslat mögött álló kulcs az API, vagyis az alkalmazásprogramozási interfész. Ez a „továbbító” a programok között, amelyek így kommunikálni tudnak egymással. De hogyan is működik ez? És mi köze a mesterséges intelligenciának ehhez? Nézzük meg közelebbről.

Az API hívás alapvetően egy üzenet, amit a mi alkalmazásunk, a kliens küld a szervernek, hogy egy szolgáltatást, vagy információt kérjen. Mint amikor a pincérnél rendelünk egy étteremben. Az API a pincér, aki elviszi a rendelésünket (API hívás) a konyhába (szerver), majd visszahozza nekünk az ételt (válasz). Például, ha egy alkalmazásban a Facebook API-t használjuk, amikor bejelentkezünk a Facebook fiókunkkal, az alkalmazás egy API hívást küld a Facebooknak a hitelesítési adatokkal, és várja a választ: bejelentkezhetünk-e, vagy sem.

Hirdetés:

A ma hajnalban bejelentett gpt-3.5-turbo-0613 és gpt-4-0613 AI modellek képesek „érzékelni”, mikor kell hívniuk egy funkciót az input alapján, és adnak vissza egy úgynevezett JSON objektumot, amely tartalmazza a funkció argumentumait. Az előnyök? Strukturált adatokat kaphatunk vissza a modelltől, melyeket könnyen feldolgozhatunk. Azonban szükség lehet a felhasználó megerősítésére bizonyos esetekben, mivel a modellek képesek paramétereket „hallucinálni”, vagy érvénytelen JSON-t generálni.

A folyamat lépésről lépésre az alábbiak szerint zajlik:

Hívjuk a modellt a felhasználói lekérdezéssel és egy funkciókészlettel a functions paraméterben.
A modell dönt arról, hogy hívjon-e egy funkciót; ha igen, a visszaküldött content egy stringgé alakított JSON objektum lesz, ami az egyéni sémánknak felel meg.
A programunk ezt a stringet JSON formátumban feldolgozza, majd ha léteznek, a megfelelő funkciót hívja a megadott argumentumokkal.
A modellt újra hívjuk úgy, hogy hozzáadjuk a funkció válaszát egy új üzenetként, majd a modellt megkérjük, hogy foglalja össze az eredményeket a felhasználónak.

Az alkalmazási területek száma szinte végtelen: Chatbotok létrehozása, amelyek kérdésekre válaszolnak külső API-k hívásával, természetes nyelv átalakítása API hívásokká, strukturált adatok kinyerése szövegből, és még sorolhatnánk. A gpt-3.5-turbo-0613 és gpt-4-0613 modellek lehetővé teszik a fejlesztőknek, hogy kreatív módon használják a mesterséges intelligenciát, amint azt soha korábban nem tették.

 

Vélemény, hozzászólás?