Az optikai számítógépek jövője: A fény sebességével
Moore törvénye már így is meglehetősen gyors. Az elmélet szerint a számítógépes chipek körülbelül kétévente kétszer annyi tranzisztort tartalmaznak, ami jelentős ugrást eredményez a sebességben és a hatékonyságban. Azonban a mélytanulás korszakának számítástechnikai igényei még ennél is gyorsabban növekednek – olyan ütemben, amely valószínűleg nem fenntartható. A Nemzetközi Energiaügynökség előrejelzése szerint a mesterséges intelligencia 2026-ban tízszer annyi energiát fog fogyasztani, mint 2023-ban, és az adatközpontok akkor annyi energiát fognak felhasználni, mint Japán.
„A mesterséges intelligencia által igényelt számítástechnikai teljesítmény háromhavonta megduplázódik,” mondta Nick Harris, a Lightmatter számítástechnikai hardvercég alapítója és vezérigazgatója – ez sokkal gyorsabb, mint amit Moore törvénye jósol. „Ez cégeket és gazdaságokat fog tönkretenni.”
Optimális Optikai
Elméletben a fény csábító potenciális előnyöket kínál. Az optikai jelek például több információt tudnak hordozni, mint az elektromosak – nagyobb a sávszélességük. Az optikai frekvenciák is sokkal magasabbak, mint az elektromosak, így az optikai rendszerek több számítási lépést tudnak végrehajtani rövidebb idő alatt és kisebb késleltetéssel.
És ott van a hatékonysági probléma is. Az elektronikus chipek viszonylagos pazarlása mellett azok annyira felmelegednek, hogy a tranzisztorok – a számítógépek szívében lévő apró kapcsolók – csak egy kis része lehet aktív bármelyik pillanatban. Az optikai számítógépek elméletben több műveletet tudnának egyszerre végrehajtani, több adatot feldolgozva kevesebb energia felhasználásával.
„Ha ki tudnánk használni ezeket az előnyöket,” mondta Gordon Wetzstein, a Stanford Egyetem villamosmérnöke, „ez sok új lehetőséget nyitna meg.”
Fényes Matematikai Műveletek
A mátrixok, vagyis a számok tömbjeinek szorzása sok nehéz számítástechnikai feladat alapját képezi. A neurális hálózatokban különösen a mátrixszorzás alapvető lépés mind a hálózatok régi adatokon történő betanításában, mind az új adatok feldolgozásában a betanított hálózatokban. És a fény talán jobb közeg lehet a mátrixszorzáshoz, mint az elektromosság.
Ez a megközelítés 2017-ben robbant be az AI számítástechnikába, amikor a Massachusetts Institute of Technology kutatócsoportja leírta, hogyan lehet optikai neurális hálózatot építeni szilícium chipen. A kutatók a szorzandó mennyiségeket fénysugarakba kódolták, majd a sugarakat olyan komponenseken küldték át, amelyek megváltoztatták a fényhullámok oszcillációját – minden fázisváltoztatás egy szorzási lépést képviselt. A sugarak ismételt osztásával, fázisuk megváltoztatásával és újraegyesítésükkel a fény hatékonyan elvégezte a mátrixszorzást. A chip végén a kutatók fénysugár-detektorokat helyeztek el, amelyek mérték a fény sugarait és feltárták az eredményt.
A kutatók kísérleti eszközüket megtanították magánhangzók felismerésére, ami egy közös benchmark feladat a neurális hálózatok számára. A fény előnyeivel gyorsabban és hatékonyabban tudta ezt végrehajtani, mint egy elektronikus eszköz. Más kutatók már tudták, hogy a fény potenciálisan jó lehet a mátrixszorzáshoz; a 2017-es tanulmány megmutatta, hogyan lehet ezt a gyakorlatban megvalósítani.
A tanulmány „masszív, megújult érdeklődést váltott ki az optikai neurális hálózatok iránt,” mondta Peter McMahon, a Cornell Egyetem fotonikai szakértője. „Ez a tanulmány rendkívül befolyásos volt.”
Fényes Ötletek
A 2017-es tanulmány óta a terület folyamatos fejlődésen ment keresztül, mivel különböző kutatók új típusú optikai számítógépeket találtak ki. Englund és több kollégája nemrégiben bemutatta az új optikai hálózatukat, amelyet HITOP-nak neveztek el, és amely több előrelépést is magában foglal. A legfontosabb, hogy a számítási teljesítmény növelését célozza meg idő, tér és hullámhossz tekintetében.
Zaijun Chen, az MIT egykori posztdoktori kutatója, aki most a Dél-Kaliforniai Egyetemen dolgozik, elmondta, hogy ez segít a HITOP-nak leküzdeni az optikai neurális hálózatok egyik hátrányát: jelentős energia szükséges az adatok átviteléhez az elektronikus komponensekből az optikaiakba, és fordítva. De az információ három dimenzióba való csomagolásával Chen szerint gyorsabban juttatja át az adatokat az ONN-en, és az energia költségét sok számításra osztja szét. Ez csökkenti a számítási költséget. A kutatók arról számoltak be, hogy a HITOP 25 000-szer nagyobb gépi tanulási modelleket tud futtatni, mint az előző chip-alapú ONN-ek.
Az optikai számítógépek különböző előnyökkel rendelkező más csoportok is létrehoztak. Tavaly a Pennsylvaniai Egyetem csapata egy új típusú ONN-t írt le, amely szokatlan rugalmasságot kínál. Ez a chip-alapú rendszer lézert irányít a félvezető egy részére, amely az elektronikus chipet alkotja, megváltoztatva a félvezető optikai tulajdonságait. A lézer hatékonyan térképezi fel az optikai jel útvonalát – és így a végrehajtott számítást. Ez lehetővé teszi a kutatók számára, hogy könnyen újrakonfigurálják a rendszer működését.
„Ami itt van, az valami hihetetlenül egyszerű,” mondta Tianwei Wu, a tanulmány vezető szerzője. „Újraprogramozhatjuk, változtatva a lézermintákat menet közben.” A kutatók a rendszert egy neurális hálózat tervezésére használták, amely sikeresen megkülönböztette a magánhangzó hangokat. A legtöbb fotonikai rendszernek képzésre van szüksége, mielőtt megépítenék, mivel a képzés szükségszerűen magában foglalja a kapcsolatok újrakonfigurálását. De mivel ez a rendszer könnyen újrakonfigurálható, a kutatók a modellt a félvezetőre történő telepítés után képezték ki. Most tervezik a chip méretének növelését és több információ kódolását különböző fény színekben, ami növelheti az általa kezelhető adat mennyiségét.
Ez olyan előrelépés, amely még Psaltis-t is lenyűgözi, aki az 1990-es években építette az arcfelismerő rendszert. „A 40 évvel ezelőtti legvadabb álmaink nagyon szerények voltak ahhoz képest, ami valójában történt.”
Az Első Fénysugarak
Míg az optikai számítástechnika az elmúlt években gyorsan fejlődött, még mindig messze van attól, hogy kiszorítsa a laboratóriumokon kívül a neurális hálózatokat futtató elektronikus chipeket. A tanulmányok bejelentik a fotonikai rendszereket, amelyek jobban működnek, mint az elektronikusak, de általában kis modelleket futtatnak régi hálózati tervezésekkel és kis munkaterhelésekkel. És sok bejelentett adat a fotonikai fölényről nem mond el mindent, mondta Bhavin Shastri, az Ontario-i Queen’s University munkatársa. „Nagyon nehéz almát almával összehasonlítani az elektronikával,” mondta. „Például, amikor lézereket használnak, nem igazán beszélnek a lézerek működtetéséhez szükséges energiáról.”
A laboratóriumi rendszereket fel kell méretezni, mielőtt versenyképes előnyöket mutathatnának. „Mekkora méretűre kell növelni ahhoz, hogy nyerjen?” kérdezte McMahon. A válasz: rendkívül nagyra. Ezért senki sem tudja felülmúlni az Nvidia által készített chipeket, amelyek sok fejlett AI rendszert működtetnek ma. Rengeteg mérnöki rejtvényt kell megoldani az út során – olyan kérdéseket, amelyeket az elektronikai oldal évtizedek alatt megoldott. „Az elektronika nagy előnnyel indul,” mondta McMahon.
Néhány kutató úgy véli, hogy az ONN-alapú AI rendszerek először speciális alkalmazásokban találják meg a sikert, ahol egyedi előnyöket biztosítanak. Shastri szerint az egyik ígéretes felhasználási terület a különböző vezeték nélküli átvitelek közötti interferencia ellensúlyozása, például az 5G mobil tornyok és a radar magasságmérők között, amelyek segítik a repülőgépek navigációját. Az év elején Shastri és több kollégája létrehozott egy ONN-t, amely valós időben és kevesebb mint 15 pikoszekundumos (15 billiomod másodperc) feldolgozási késleltetéssel tud különböző átviteleket rendezni és egy érdekes jelet kiválasztani – ez kevesebb mint egy ezred része annak az időnek, amit egy elektronikus rendszer igényelne, miközben kevesebb mint 1/70-ét használja az energiának.
De McMahon szerint a nagy vízió – egy optikai neurális hálózat, amely általános használatra felülmúlhatja az elektronikus rendszereket – továbbra is érdemes folytatni. Tavaly csoportja szimulációkat futtatott, amelyek azt mutatták, hogy egy évtizeden belül egy elég nagy optikai rendszer több mint 1,000-szer hatékonyabbá teheti néhány AI modellt, mint a jövőbeli elektronikus rendszerek. „Sok cég most keményen próbál egy 1,5-szeres előnyt elérni. Egy ezerszeres előny, az csodálatos lenne,” mondta. „Ez talán egy 10 éves projekt – ha sikerül.”
Érdekesség: Az optikai számítógépek egyik legnagyobb előnye, hogy elméletben képesek lennének valós időben feldolgozni az emberi agy által végzett számításokat, ami forradalmasíthatná az AI és a gépi tanulás területét.