Az MIT Számítástechnikai és Mesterséges Intelligencia Laboratórium (CSAIL) kutatói egy új mesterséges intelligencia modellt fejlesztettek ki, amely a neurális oszcillációk elvein alapul, célja pedig, hogy jelentősen elősegítse a gépi tanulási algoritmusok képességét a hosszú adatsorok kezelésében. Az AI gyakran küzd azzal, hogy bonyolult információkat elemezzen, amelyek hosszú időszakok alatt bontakoznak ki, mint például az éghajlati trendek, biológiai jelek vagy pénzügyi adatok.
Az új típusú AI modell, amelyet “állapot-tér modellnek” neveznek, kifejezetten arra lett tervezve, hogy hatékonyabban megértse ezeket a sorozatos mintákat. Azonban a meglévő állapot-tér modellek gyakran kihívásokkal néznek szembe — instabillá válhatnak vagy jelentős számítási erőforrást igényelnek, amikor hosszú adatsorokat dolgoznak fel.
A problémák megoldására a CSAIL kutatói, T. Konstantin Rusch és Daniela Rus, kifejlesztették a “lineáris oszcilláló állapot-tér modelleket” (LinOSS), amelyek a kényszerített harmonikus oszcillátorok elveit használják fel — ez egy olyan koncepció, amely mélyen gyökerezik a fizikában és megfigyelhető a biológiai neurális hálózatokban is. Ez a megközelítés stabil, kifejező és számításilag hatékony előrejelzéseket biztosít, anélkül, hogy túlságosan szigorú feltételeket támasztana a modell paramétereivel szemben.
„Célunk az volt, hogy megörökítsük a biológiai neurális rendszerek stabilitását és hatékonyságát, és ezeket az elveket egy gépi tanulási keretrendszerbe ültessük át” – magyarázza Rusch. „A LinOSS-szal most megbízhatóan tudunk tanulni hosszú távú kölcsönhatásokat, még olyan sorozatokban is, amelyek több százezer adatpontot ölelnek fel.”
A LinOSS modell egyedülálló abban, hogy stabil előrejelzést biztosít, miközben sokkal kevésbé szigorú tervezési választásokat igényel, mint a korábbi módszerek. Továbbá, a kutatók rigorózusan bizonyították a modell univerzális közelítési képességét, ami azt jelenti, hogy képes bármely folytonos, ok-okozati funkciót közelíteni, amely a bemeneti és kimeneti sorozatok között áll fenn.
Empirikus tesztelés során a LinOSS folyamatosan felülmúlta a meglévő csúcsmodelleket különböző igényes sorozatos osztályozási és előrejelzési feladatokban. Különösen figyelemre méltó, hogy a LinOSS közel kétszer jobban teljesített a széles körben használt Mamba modellhez képest, extrém hosszúságú sorozatokkal kapcsolatos feladatokban.
A kutatás jelentőségét elismerve, a munkát az ICLR 2025 konferencián történő szóbeli bemutatásra választották ki — ez egy olyan megtiszteltetés, amelyet csak a benyújtott anyagok 1% -a kap meg. Az MIT kutatói előrejelzik, hogy a LinOSS modell jelentős hatással lehet bármilyen területre, amely előnyös lehet a pontos és hatékony hosszú távú előrejelzés és osztályozás szempontjából, beleértve az egészségügyi elemzéseket, éghajlattudományt, autonóm vezetést és pénzügyi előrejelzést.
„Ez a munka példázza, hogy a matematikai szigor hogyan vezethet teljesítménybeli áttörésekhez és széles alkalmazásokhoz” – mondja Rus. „A LinOSS-szal a tudományos közösség számára egy erőteljes eszközt kínálunk a komplex rendszerek megértésére és előrejelzésére, hidat képezve a biológiai inspiráció és a számítástechnikai innováció között.”
A csapat úgy képzeli, hogy a LinOSS-hoz hasonló új paradigma megjelenése érdekes lehet a gépi tanulás gyakorlói számára, hogy építkezzenek rá. A jövőbeni terveik között szerepel, hogy a modellt még szélesebb spektrumú adatformákra alkalmazzák. Emellett azt javasolják, hogy a LinOSS értékes betekintést nyújthat a neurotudományba, potenciálisan mélyítve az agy megértését.
A munkájukat a Svéd Nemzeti Tudományos Alap, a Schmidt AI2050 program és az Egyesült Államok Légierő Mesterséges Intelligencia Gyorsítója támogatta.
Érdekes tény: Az AI modellek, mint a LinOSS, nemcsak a gépi tanulásban, hanem a tudományos kutatásban is segítenek, például a gyógyszerfejlesztés gyorsításában.
Források: MIT CSAIL, ICLR 2025, Svéd Nemzeti Tudományos Alap, Schmidt AI2050 program, Egyesült Államok Légierő Mesterséges Intelligencia Gyorsítója



