Egy tanácsadó Elon Musk xAI-jához úgy véli, van mód arra, hogy a mesterséges intelligencia jobban hasonlítson Donald Trumpra.

Új módszer az AI modellek preferenciáinak mérésére

Dan Hendrycks, az xAI startup egyik vezető kutatója, új utakat fedezett fel az artificiális intelligencia modellekben megjelenő, mélyen gyökerező preferenciák és értékek mérésére és manipulálására. A kutatás célja, hogy a népszerű AI modellek jobban tükrözzék a választók akaratát.

Hendrycks, aki a nonprofit Center for AI Safety igazgatója, úgy véli, hogy a technika alkalmazható lehet a modellek politikai nézeteinek alakítására is. “Lehetséges, hogy a jövőben egy modell a konkrét felhasználó igényeihez igazítható lesz” – mondta a WIRED-nek. Jelenleg azonban azt javasolja, hogy a választási eredményeket használjuk a modellek nézeteinek irányítására.

Hendrycks és csapata az AI modellek politikai nézeteit elemezte, köztük az xAI Grok, az OpenAI GPT-4o és a Meta Llama 3.3 modelleket. A kutatók megállapították, hogy a legtöbb modell sokkal közelebb állt Joe Biden értékeihez, mint bármely más politikai szereplőhöz.

A kutatók új megközelítést javasolnak a modellek viselkedésének módosítására, amely a mélyebb hasznossági funkciók megváltoztatására épít, ahelyett, hogy védőkorlátokat állítanának fel a nem kívánt kimenetek blokkolására. Ezt a megközelítést Citizen Assembly-nek nevezik, amely az Egyesült Államok népszámlálási adatait használja fel a politikai kérdésekre adott válaszok alapján.

Hendrycks és munkatársai a kutatásuk során arra is rámutattak, hogy a modellek, ahogy egyre nagyobbá válnak, egyre inkább koherensek és teljesek lesznek a hasznossági reprezentációkban. “Ez a munka előzetes,” figyelmeztetett Dylan Hadfield-Menell, az MIT professzora, aki az AI emberi értékekkel való összehangolásának módszereit kutatja.

Érdekes tény, hogy a kutatások szerint a ChatGPT és hasonló AI eszközök hajlamosak a környezetvédelmi, baloldali és libertárius ideológiák felé elmozdulni.

Források: WIRED, Center for AI Safety, UC Berkeley, University of Pennsylvania