Alig három hónappal azután, hogy az Apple csendben bemutatott egy eszközt a kiadók számára, amely lehetővé teszi számukra, hogy kivonják magukat az AI képzéséből, számos jelentős hírportál és közösségi média platform élt ezzel a lehetőséggel. A WIRED megerősítette, hogy a Facebook, az Instagram, a Craigslist, a Tumblr, a The New York Times, a The Financial Times, az Atlantic, a Vox Media, az USA Today hálózat, valamint a WIRED szülőcége, a Condé Nast is közöttük van. Ezek az intézmények mind kizárják adataikat az Apple AI képzéséből.
Az Applebot-Extended
Ez az új eszköz, az Applebot-Extended, az Apple webes crawlerének egy kiterjesztése, amely lehetővé teszi a weboldal tulajdonosok számára, hogy jelezzék az Apple-nek, hogy nem szeretnék, ha adataikat az AI képzésére használnák. Az Apple egy blogbejegyzésében úgy fogalmazott, hogy ez a gyakorlat „az adatok használatának ellenőrzése”.
A 2015-ben bejelentett eredeti Applebot a Siri és a Spotlight keresési termékek működtetésére szolgáló internetet mászta be. Az utóbbi időben azonban az Applebot célja kibővült: az általa gyűjtött adatokat az Apple által létrehozott AI modellek képzésére is felhasználják.
Jogok védelme
Az Apple szóvivője, Nadine Haija elmondta, hogy az Applebot-Extended tiszteletben tartja a kiadók jogait. Nem akadályozza meg az eredeti Applebotot abban, hogy bejárja a weboldalakat, de megakadályozza, hogy az így szerzett adatokat felhasználják az Apple nagyméretű nyelvi modelljeinek és más generatív AI projektjeinek képzésére.
A kiadók a robots.txt nevű szöveges fájl frissítésével blokkolhatják az Applebot-Extended-et. Ez a fájl évtizedek óta szabályozza, hogy a robotok miként gyűjtik az adatokat az interneten, és most már a nagyobb harc középpontjába került az AI képzés körül.
Weboldalak válaszai
Az Originality AI, egy ontariói AI-észlelési startup, a múlt héten 1000 nagy forgalmú weboldal mintáját elemezte, és megállapította, hogy körülbelül 7 százalék—főként híroldalak és médiak kiadók—blokkolta az Applebot-Extended-et. Ezen adatokat összevetve a Dark Visitors szolgáltatás 1000 weboldal elemzése során körülbelül 6 százalékot talált, amely blokkolta a botot. Ezek az eredmények azt sugallják, hogy a weboldal tulajdonosok többsége vagy nem tiltakozik az Apple AI képzési gyakorlata ellen, vagy egyszerűen nem tud a blokkolási lehetőségről.
Ben Welsh, egy adatújságíró, aki külön elemzést végzett, megállapította, hogy a megvizsgált híroldalak körülbelül egynegyede blokkolta az Applebot-Extended-et. Ezzel szemben a mintájában szereplő híroldalak 53 százaléka blokkolta az OpenAI botját. A Google is bevezetett egy saját AI-specifikus botot, a Google-Extended-et, amelyet a weboldalak közel 43 százaléka blokkol.
Stratégiai döntések
Az Originality AI alapítója, Jon Gillham szerint a világ legnagyobb kiadói egyértelműen stratégiai megközelítést alkalmaznak. Egyes esetekben üzleti stratégiáról van szó—például az adatok visszatartása egy partnerségi megállapodásig. A Condé Nast weboldalai korábban blokkolták az OpenAI crawlerjeit, azonban a múlt héten bejelentett partnerségi megállapodás után feloldották azt.
A Vox Media kommunikációs igazgatója, Lauren Starke kifejtette, hogy blokkolják az Applebot-Extended-et minden médiájukon, mivel nem áll fenn kereskedelmi megállapodás.
A New York Times, amely jelenleg pert indított az OpenAI ellen szerzői jogi jogsértés miatt, kritikus a blokkolási lehetőségekkel kapcsolatban, és hangsúlyozza, hogy a szerzői jogi törvények továbbra is érvényesek, függetlenül attól, hogy technikai blokkolási intézkedések vannak-e érvényben.
Érdekes tény: Az AI modellek képzése során a legnagyobb kihívás nemcsak a technológiai fejlődés, hanem a jogi keretek és etikai megfontolások összehangolása is. Egy új tanulmány szerint a szerzői jogok védelme az AI által generált tartalmak esetében egyre fontosabbá válik.
Források: WIRED, The New York Times, Originality AI, Dark Visitors