Új megközelítés a mesterséges intelligencia döntéseinek igazságosságában
A vállalatok és szervezetek egyre gyakrabban alkalmaznak gépi tanulási modelleket a szűkös erőforrások vagy lehetőségek elosztására. Ezek a modellek segíthetnek például a cégeknek az önéletrajzok átvizsgálásában, hogy kiválasszák az állásinterjúra hívandó jelölteket, vagy a kórházaknak a veseátültetésre váró betegek rangsorolásában a túlélési esélyeik alapján. Az ilyen modellek telepítésekor a felhasználók általában arra törekednek, hogy a predikciók igazságosak legyenek, a torzítás csökkentésével. Ez gyakran olyan technikákat foglal magában, mint a modellek döntéseihez használt jellemzők beállítása vagy a generált pontszámok kalibrálása.
Azonban a MIT és a Northeastern Egyetem kutatói szerint ezek a módszerek nem elegendőek a strukturális igazságtalanságok és az inherens bizonytalanságok kezelésére. Egy új tanulmányukban bemutatják, hogyan javíthatja a modell döntéseinek strukturált randomizálása az igazságosságot bizonyos helyzetekben. Például, ha több cég ugyanazt a gépi tanulási modellt használja az állásinterjú jelöltek rangsorolására determinisztikusan — bármiféle randomizálás nélkül —, akkor egy érdemes jelölt minden állásra az utolsó helyre kerülhet, talán az online űrlapon adott válaszok súlyozása miatt. A randomizálás bevezetése megakadályozhatja, hogy egy érdemes személy vagy csoport mindig meg legyen fosztva egy szűkös erőforrástól, például egy állásinterjútól.
Kutatásaik során a kutatók megállapították, hogy a randomizálás különösen előnyös lehet, amikor a modell döntései bizonytalanságot tartalmaznak, vagy amikor ugyanaz a csoport folyamatosan negatív döntéseket kap. Azt is bemutatják, hogyan lehet egy keretrendszert használni, hogy specifikus mennyiségű randomizálást vezessenek be egy modell döntéseibe, erőforrásokat egy súlyozott lottóval elosztva. Ez a módszer, amelyet az egyén saját helyzetére szabhat, javíthatja az igazságosságot anélkül, hogy rontaná a modell hatékonyságát vagy pontosságát.
„Még ha képes lennél is igazságos predikciókat tenni, vajon érdemes-e szigorúan pontszámok vagy rangsorok alapján eldönteni ezeket a szociális elosztásokat?” — mondja Shomik Jain, az Institute for Data, Systems, and Society (IDSS) posztgraduális hallgatója és a tanulmány vezető szerzője. „Amint a dolgok méreteződnek, és egyre több lehetőséget döntenek el ezek az algoritmusok, a pontszámok inherens bizonytalanságai felerősödhetnek. Megmutatjuk, hogy az igazságosság némi randomizálást követelhet meg.”
Jain mellett a tanulmányt Kathleen Creel, a Northeastern Egyetem filozófia és számítástechnika adjunktusa; és Ashia Wilson, a Department of Electrical Engineering and Computer Science Lister Brothers Karrier Fejlesztési Professzora és a Laboratory for Information and Decision Systems (LIDS) vezető kutatója írta. A kutatás bemutatásra kerül a Nemzetközi Gépi Tanulási Konferencián.
Ez a munka egy korábbi tanulmányra épül, amelyben a kutatók azt vizsgálták, hogy milyen károk keletkezhetnek, amikor valaki determinisztikus rendszereket használ skálán. Megállapították, hogy egy gépi tanulási modell determinisztikus erőforrás-elosztása felerősítheti a tanulási adatokban meglévő egyenlőtlenségeket, amelyek megerősíthetik a torzításokat és a rendszerszintű egyenlőtlenségeket.
„A randomizálás egy nagyon hasznos fogalom a statisztikában, és örömünkre szolgál, hogy kielégíti az igazságossági követelményeket mind rendszerszinten, mind egyéni szinten” — mondja Wilson.
Ebben a tanulmányban azt vizsgálták, mikor javíthatja a randomizálás az igazságosságot. Elemzésüket John Broome filozófus gondolatai köré építették, aki arról írt, hogy a lottók használata hogyan adhatja meg a szűkös erőforrások kiosztásának értékét egy olyan módon, amely tiszteletben tartja az egyének minden igényét.
Egy személy igénye egy szűkös erőforrásra, mint például egy veseátültetés, származhat érdemből, szükségből vagy rászorultságból. Például mindenkinek joga van az élethez, és az igényük egy veseátültetésre ebből a jogból származhat, magyarázza Wilson.
„Amikor elismered, hogy az embereknek különböző igényeik vannak ezekre a szűkös erőforrásokra, az igazságosság megköveteli, hogy tiszteletben tartsuk az egyének minden igényét. Ha mindig valakinek, aki erősebb igénnyel rendelkezik, adjuk az erőforrást, az igazságos?” — mondja Jain.
Ez a fajta determinisztikus elosztás rendszerszintű kizárást okozhat, vagy súlyosbíthatja a mintázott egyenlőtlenséget, amely akkor következik be, amikor egy elosztás növeli az egyén jövőbeli elosztások megszerzésének valószínűségét. Emellett a gépi tanulási modellek hibákat is elkövethetnek, és egy determinisztikus megközelítés ugyanazt a hibát ismételheti meg.
A randomizálás megoldhatja ezeket a problémákat, de ez nem jelenti azt, hogy minden modell által hozott döntést egyenlő mértékben kell randomizálni.
Strukturált randomizálás
A kutatók egy súlyozott lottót használnak, hogy a randomizálás szintjét a modell döntéshozatalában fennálló bizonytalanság mértéke alapján állítsák be. Egy kevésbé biztos döntésnek több randomizálást kell tartalmaznia.
„A veseelosztásban általában a tervezés a várható élettartam köré épül, és ez mélyen bizonytalan. Ha két beteg csak öt év különbséggel rendelkezik, sokkal nehezebbé válik a mérés. Ki akarjuk használni ezt a bizonytalansági szintet, hogy testre szabjuk a randomizálást” — mondja Wilson.
A kutatók statisztikai bizonytalansági kvantifikációs módszereket használtak annak meghatározására, hogy különböző helyzetekben mennyi randomizálás szükséges. Megmutatják, hogy a kalibrált randomizálás igazságosabb eredményekhez vezethet az egyének számára anélkül, hogy jelentősen befolyásolná a modell hasznosságát vagy hatékonyságát.
„Van egy egyensúly a teljes hasznosság és az egyének jogainak tiszteletben tartása között, akik szűkös erőforrást kapnak, de gyakran a kompromisszum viszonylag kicsi” — mondja Wilson.
A kutatók hangsúlyozzák, hogy vannak olyan helyzetek, ahol a döntések randomizálása nem javítaná az igazságosságot, és káros lehet az egyénekre nézve, például a büntető igazságszolgáltatásban.
De lehetnek más területek, ahol a randomizálás javíthatja az igazságosságot, például a felsőoktatásba való felvételnél, és a kutatók a jövőben további felhasználási esetek tanulmányozását tervezik. Azt is meg akarják vizsgálni, hogy a randomizálás hogyan befolyásolhat más tényezőket, például a versenyt vagy az árakat, és hogyan lehetne felhasználni a gépi tanulási modellek robusztusságának javítására.
„Azt reméljük, hogy tanulmányunk az első lépés abba az irányba, hogy bemutassuk, a randomizálás előnyös lehet. Randomizálást kínálunk, mint eszközt. Hogy mennyire akarják ezt használni, az az elosztásban részt vevő összes érintett döntése lesz. És természetesen, hogyan döntenek, az egy másik kutatási kérdés” — mondja Wilson.
Fun Fact: A mesterséges intelligencia területén az egyik első randomizálási technikát az 1950-es években alkalmazták Monte Carlo szimulációk során, amelyeket a fizikai rendszerek viselkedésének modellezésére használtak.
Források: MIT News, Massachusetts Institute of Technology, International Conference on Machine Learning