Események
A Google DeepMind bemutatja az első AI-vezérelt robot asztalitenisz játékost
Szerdán a Google DeepMind kutatói bejelentették az első AI-vezérelt robot asztalitenisz játékost, amely képes versenyezni az amatőr emberekkel. A rendszer egy ABB IRB 1100 ipari robotkar és a DeepMind által kifejlesztett testreszabott AI szoftver kombinációját használja. Míg egy szakértő emberi játékos továbbra is legyőzheti a robotot, a rendszer megmutatja a gépek potenciálját a komplex fizikai feladatok elsajátításában, amelyek azonnali döntéshozatalt és alkalmazkodást igényelnek.
„Ez az első robot ügynök, amely képes sportot játszani emberekkel emberi szinten,” írták a kutatók egy preprint cikkben az arXiv-on. „Ez mérföldkő a robot tanulás és irányítás terén.”
A névtelen robot ügynök (javasoljuk, hogy nevezzük AlphaPong-nak), amelyet David B. D’Ambrosio, Saminda Abeyruwan és Laura Graesser csapata fejlesztett ki, figyelemre méltó teljesítményt mutatott be egy sor mérkőzés során, ahol különböző készségi szintű emberi játékosok ellen játszott. Egy 29 résztvevős tanulmányban az AI-vezérelt robot a mérkőzéseinek 45%-át megnyerte, bizonyítva ezzel a szilárd amatőr szintű játékot. Különösen figyelemre méltó, hogy a kezdők ellen 100%-os, míg a középhaladók ellen 55%-os győzelmi arányt ért el, bár a haladó ellenfelek ellen küzdelmesebben teljesített.
A fizikai felépítés a már említett IRB 1100-ból áll, amely egy 6 fokú szabadságfokú robotkar, két lineáris sínen elhelyezve, lehetővé téve számára, hogy szabadon mozogjon egy 2D-s síkban. Nagy sebességű kamerák követik a labda helyzetét, míg egy mozgásérzékelő rendszer figyeli az emberi ellenfél ütőmozgásait.
Az AI a középpontban
A robotkar működésének megalkotásához a DeepMind kutatói egy két szintből álló megközelítést dolgoztak ki, amely lehetővé teszi, hogy a robot konkrét asztalitenisz technikákat hajtson végre, miközben valós időben alkalmazkodik az ellenfél játékstílusához. Más szóval, elég alkalmazkodó ahhoz, hogy bármilyen amatőr emberrel játszhasson asztaliteniszt anélkül, hogy specifikus edzést igényelne.
A rendszer architektúrája alacsony szintű ügyességi vezérlőket (neural network policy-ket, amelyeket specifikus asztalitenisz technikák végrehajtására képeztek ki, mint például a tenyeres ütések, fonák visszaütések vagy szerválási reakciók) kombinál magas szintű stratégiai döntéshozóval (egy összetettebb AI rendszer, amely elemzi a játék állapotát, alkalmazkodik az ellenfél stílusához, és kiválasztja, hogy mely alacsony szintű ügyességi politikát aktiválja minden bejövő labda esetében).
A kutatók kijelentették, hogy a projekt egyik kulcsinnovációja az AI modellek képzésére használt módszer volt. A kutatók egy hibrid megközelítést választottak, amely megerősítéses tanulást használt egy szimulált fizikai környezetben, miközben a képzési adatokat valós példákra alapozta. Ez a technika lehetővé tette a robot számára, hogy körülbelül 17,500 valós labda trajektóriából tanuljon – ami meglehetősen kicsi adatbázis egy komplex feladathoz.
A kutatók iteratív folyamatot használtak a robot ügyességének finomítására. Egy kis adatbázissal indultak az ember-ember játékból, majd a robotot valódi ellenfelek ellen játszatták. Minden mérkőzés új adatokat generált a labda trajektóriáiról és az emberi stratégiákról, amelyeket a csapat visszajuttatott a szimulációba további képzés céljából. Ez a folyamat, amelyet hétszer ismételtek meg, lehetővé tette a robot számára, hogy folyamatosan alkalmazkodjon a egyre ügyesebb ellenfelekhez és változatos játékstílusokhoz. A végső fordulóra az AI több mint 14,000 rally labdát és 3,000 szervát tanult meg, létrehozva egy asztalitenisz tudásbázist, amely segített áthidalni a szimuláció és a valóság közötti szakadékot.
Érdekes, hogy az Nvidia is kísérletezik hasonló szimulált fizikai rendszerekkel, mint például a Eureka, amely lehetővé teszi egy AI modell számára, hogy gyorsan megtanulja irányítani a robotkart szimulált térben, a valós világ helyett (mivel a fizika felgyorsítható a szimulációban, és ezer egyidejű kísérlet is zajlhat). Ez a módszer várhatóan drámaian csökkenti az időt és az erőforrásokat, amelyeket a robotok komplex interakciókra való képzésére szükséges a jövőben.
Az AI ellen játszani élvezetes volt
A technikai eredmények mellett a tanulmány azt is vizsgálta, hogy az emberek hogyan élik meg az AI ellen játszást. Meglepetésre még azok a játékosok is, akik vesztettek a robot ellen, arról számoltak be, hogy élvezték az élményt. „Minden készségi csoport és győzelmi arány mellett a játékosok egyetértettek abban, hogy a robot ellen játszani ‘szórakoztató’ és ‘érdekes’ volt,” jegyezték meg a kutatók. Ez a pozitív fogadtatás potenciális alkalmazásokat sugall az AI számára a sportedzésben és a szórakoztatásban.
Fontos megjegyezni, hogy a rendszernek vannak korlátai is. Nehezen birkózik meg a rendkívül gyors vagy magas labdákkal, nehezen olvassa el az intenzív pörgetést, és gyengébben teljesít a fonák játékokban. A Google DeepMind megosztott egy példavideót az AI ügynökről, amely pontot veszít egy haladó játékossal szemben, mivel úgy tűnik, hogy nehezen reagál a gyors ütésre.
A kutatók szerint ennek a robot asztalitenisz csodának a hatásai túlmutatnak az asztalitenisz világán. A projekt során kifejlesztett technikák széleskörű robotikai feladatokra alkalmazhatók, amelyek gyors reakciókat és alkalmazkodást igényelnek az előre nem látható emberi viselkedéshez. A gyártástól az egészségügyig (vagy csak egy ütővel való ismételt pofonok osztogatásáig) a potenciális alkalmazások valóban széleskörűnek tűnnek.
A Google DeepMind kutatócsapata hangsúlyozza, hogy további finomításokkal úgy vélik, a rendszer a jövőben potenciálisan versenyezhet haladó asztalitenisz játékosokkal. A DeepMind nem ismeretlen az AI modellek létrehozásában, amelyek képesek legyőzni az emberi játékosokat, beleértve az AlphaZero-t és az AlphaGo-t. Ezzel az új robot ügynökkel úgy tűnik, hogy a kutatócég túllép a társasjátékokon és a fizikai sportok világába lép. A sakk és a Jeopardy már elbukott AI-vezérelt győztesek előtt – talán az asztalitenisz a következő.
Érdekesség: A robot asztalitenisz játékos nemcsak az amatőr játékosok ellen versenyez, hanem a kutatók szerint az AI sportedzésben és szórakoztatásban is potenciálisan alkalmazható!
Források: Google DeepMind, arXiv