Andrew Barto és Richard Sutton felfedezései forradalmasították a mesterséges intelligencia fejlődését, különösen a megerősítéses tanulás területén. 1977-ben Barto, a Massachusettsi Egyetem kutatójaként, egy új elméletet kezdett el vizsgálni, miszerint a neuronok hedonista módon viselkednek. Az alapgondolat az volt, hogy az emberi agy milliárdnyi idegsejtje mind arra törekszik, hogy maximalizálja a örömöt és minimalizálja a fájdalmat.
Egy évvel később csatlakozott hozzá Sutton, aki szintén fiatal kutató volt. Együtt dolgoztak azon, hogy a humán intelligenciát ezzel az egyszerű koncepcióval magyarázzák meg, és ezt alkalmazták a mesterséges intelligenciában. Az eredmény a megerősítéses tanulás lett, amely lehetővé tette az A.I. rendszerek számára, hogy a digitális értelemben vett öröm és fájdalom alapján tanuljanak.
Szerdán a Számítástechnikai Gépek Társasága, a világ legnagyobb számítástechnikai szakemberekből álló társasága bejelentette, hogy Dr. Barto és Dr. Sutton megnyerték az idei Turing-díjat a megerősítéses tanulás területén végzett munkájukért. A Turing-díjat, amelyet 1966-ban alapítottak, gyakran a számítástechnika Nobel-díjaként emlegetik. A két tudós megosztja a díjjal járó 1 millió dolláros pénzjutalmat.
Az elmúlt évtizedben a megerősítéses tanulás kulcsszerepet játszott a mesterséges intelligencia fejlődésében, beleértve a Google AlphaGo és az OpenAI ChatGPT áttörő technológiáit. Azok a technikák, melyek ezeket a rendszereket működtették, Dr. Barto és Dr. Sutton munkáján alapultak. Oren Etzioni, a Washingtoni Egyetem emeritus számítástechnikai professzora és az Allen Intézet a Mesterséges Intelligenciáért alapító vezérigazgatója így nyilatkozott: „Ők a megerősítéses tanulás vitathatatlan úttörői. Ők generálták a kulcsötleteket — és ők írták a témáról szóló könyvet.”
A könyv, amely „Reinforcement Learning: An Introduction” címmel 1998-ban jelent meg, máig a legátfogóbb mű a témában, és sok szakértő szerint csak most kezdi felfedezni a potenciálját.
Érdekes tény: A megerősítéses tanulás technikái nemcsak a chatbots világában hasznosak, hanem a robotikában és a videojátékokban is egyre nagyobb szerepet játszanak.
Források:
- The Association for Computing Machinery
- University of Massachusetts, Amherst
- University of Washington
- OpenAI