A mesterséges intelligencia által vezérelt kódolás jövője itt van: Készülj fel a forradalomra!

AI szoftverügynökök forradalma

Fejlesztés

AI szoftverügynökök forradalma

Nem vagyok képzett programozó, de egy ingyenes program, az SWE-agent segítségével sikerült kijavítanom egy bonyolult hibát, amely egy rosszul elnevezett fájlból adódott különböző kódtárakban a GitHub szoftver-hosting oldalon. Az SWE-agent megvizsgálta a problémát, és meghatározta, hogy a hiba gyökere egy sor, amely rossz helyre mutat. Ezután átnavigált a projekten, megtalálta a fájlt, és javította a kódot, hogy minden megfelelően működjön.

Sok fejlesztő már most is használ mesterséges intelligenciát a szoftverek gyorsabb írásához. A GitHub Copilot volt az első integrált fejlesztői környezet, amely kihasználta az AI-t, de számos IDE már most is automatikusan befejezi a kódrészleteket, amikor a fejlesztő elkezd gépelni. Kérdéseket is feltehetünk az AI-nak a kódról, vagy javaslatokat kérhetünk a javításra.

John Yang és Carlos Jimenez, két princetoni PhD hallgató, tavaly nyáron kezdtek el beszélgetni arról, hogyan válhatna az AI valódi szoftvermérnökké. Ez vezette őket és másokat Princetonban az SWE-bench kifejlesztéséhez, amely egy sor mércét tartalmaz az AI eszközök tesztelésére különböző kódolási feladatok során. Az októberi megjelenés után a csapat kifejlesztette saját eszközét, az SWE-agent-et, hogy mestere legyen ezeknek a feladatoknak.

Az SWE-agent („SWE” a „software engineering” rövidítése) egyike azoknak a sokkal erősebb AI kódoló programoknak, amelyek nem csak kódsorokat írnak, hanem úgynevezett szoftverügynökként működnek, kihasználva az eszközöket a szoftverek kezeléséhez, hibakereséséhez és szervezéséhez. A Devin startup márciusban vírusvideót tett közzé egy ilyen eszköz demójáról.

Ofir Press, a princetoni csapat tagja szerint az SWE-bench segíthet az OpenAI-nak tesztelni a szoftverügynökök teljesítményét és megbízhatóságát. „Ez csak az én véleményem, de úgy gondolom, hogy hamarosan ki fognak adni egy szoftverügynököt” – mondja Press.

Az OpenAI nem kívánt nyilatkozni, de egy másik forrás, aki ismeri a cég tevékenységét, és névtelenséget kérve elmondta a WIRED-nek, hogy az OpenAI határozottan dolgozik kódoló ügynökökön. Ahogy a GitHub Copilot is bebizonyította, hogy a nagy nyelvi modellek képesek kódot írni és növelni a programozók produktivitását, az SWE-agent típusú eszközök is bizonyíthatják, hogy az AI ügynökök megbízhatóan működhetnek a kódok építésénél és karbantartásánál.

Számos cég teszteli a szoftverfejlesztési ügynököket. Az SWE-bench rangsorának élén, amely különböző feladatokban méri az ügynökök pontszámát, egy Factory AI nevű startup áll, amelyet az AutoCodeRover követ, amely egy nyílt forráskódú bejegyzés a Szingapúri Nemzeti Egyetem csapatától.

A nagy szereplők is bekapcsolódnak. Az Amazon Q nevű szoftveríró eszköz szintén az SWE-bench egyik legjobb teljesítményűje. „A szoftverfejlesztés sokkal több, mint gépelés” – mondja Deepak Singh, az Amazon Web Services szoftverfejlesztési alelnöke.

Hozzáteszi, hogy az AWS az ügynököt használta teljes szoftverhalmazok egyik programozási nyelvről a másikra való átültetésére. „Olyan, mintha egy nagyon okos mérnök ülne melletted, és veled együtt írná és építené az alkalmazást” – mondja Singh. „Szerintem ez elég átalakító.”

Az OpenAI csapata nemrégiben segített a princetoni csapatnak javítani egy mércét az SWE-agent-hez hasonló eszközök megbízhatóságának és hatékonyságának mérésére, ami arra utal, hogy a cég szintén finomít ügynököket a kódolásra vagy más számítógépes feladatokra.

Singh szerint számos ügyfél már most is összetett háttéralkalmazásokat épít a Q használatával. Saját kísérleteim az SWE-bench-szel azt sugallják, hogy bárki, aki programoz, hamarosan ügynököket akar majd használni, hogy növelje programozási képességeit, vagy lemaradás veszélyének teszi ki magát.

Érdekesség: Az AI, amely képes hibákat kijavítani és kódot írni, egészen az 1950-es évekig nyúlik vissza, amikor Alan Turing bemutatta a „Turing-teszt” koncepcióját az AI intelligencia mérésére.

Források: WIRED, Princeton University, Amazon Web Services