Apple Podcastok: Az Automatikus Átiratok Forradalma
Ren Shelburne már belefáradt abba, hogy megpróbálja meghallgatni a barátai által ajánlott népszerű podcast epizódokat. Shelburne, aki részleges halláskárosodással és hallási feldolgozási zavarral küzd, emlékszik arra, hogy egy adott epizód befejezése nehézséget okozott. Ez egy speciális típusú műsor volt: túl sok beszélő fej, bonyolult, egymást átfedő párbeszédek és, egészen a közelmúltig, átiratok hiánya. „Az ilyeneknél teljesen elveszett vagyok, mert egyszerre túl sok minden történik,” mondja Shelburne. Nem tudta követni a műsort, így nem tudott beszélgetni róla a barátaival. „A podcastok már annyira a popkultúra és a média részévé váltak. Szeretnék része lenni ennek a beszélgetésnek.”
A Pew Research adatai szerint az Egyesült Államokban heti podcast hallgatók száma több mint négyszeresére nőtt az elmúlt évtizedben. Azonban néhány ember számára még mindig elérhetetlennek tűnik a médium. „Néha kihagyok valamit a halláskárosodásom miatt,” mondja Alexandra Wong, egy digitális hozzáférhetőséggel foglalkozó Rhodes ösztöndíjas, „és vissza kell tekernem akár öt-hat alkalommal is, hogy biztos legyek benne, hogy megértem, mi történik.”
Shelburne és Wong az Egyesült Államokban élő felnőttek mintegy 15%-ának, azaz körülbelül 37,5 millió embernek a része, akik hallókészülék nélkül nehezen hallanak, és sokan közülük feliratokra és átiratokra támaszkodnak a zene, filmek és podcastok követéséhez. A videó streaming szolgáltatók, mint a Netflix, Peacock és Hulu, szinte minden programjukhoz feliratokat kínálnak, és az időzített dalszöveg feliratok egyre inkább szabványossá válnak a zenei streamingben. A videó feliratok elterjedtségét a fogyatékkal élők közösségén túl is elfogadták; a Netflix nézőinek 80%-a legalább havonta egyszer bekapcsolja a feliratokat.
Ezzel szemben a podcasting cégek későn kapcsolódtak be a hozzáférhetőség játékába. A Sirius XM és a Gimlet perekbe keveredtek, mivel állítólag megsértették az amerikai fogyatékossági törvényt azzal, hogy nem biztosítottak átiratokat. A Spotify, amely a Gimlet tulajdonosa, szeptemberben indította el a podcast átiratokat, de a funkció csak a streaming szolgáltatás tulajdonában lévő műsorokra és az ott hosztolt podcastokra érhető el.
Az Apple márciusban bejelentette, hogy az automatikusan generált átiratok elérhetők lesznek minden új podcast epizódhoz, amelyeket az alkalmazásukon keresztül játszanak le iPadeken és iPhone-okon, a legújabb Apple operációs rendszeren. „Célunk nyilvánvalóan az, hogy a podcastokat hozzáférhetőbbé és magával ragadóbbá tegyük,” mondja Ben Cave, az Apple globális podcast vezetője.
Sarah Herrlinger, aki az Apple hozzáférhetőségi politikáját kezeli, azt mondja, hogy az átirat eszköz fejlesztése során mind fogyatékkal élő Apple alkalmazottakkal, mind külső szervezetekkel együttműködtek. Az átirat prioritássá vált az Apple Podcastok számára a fogyatékkal élő felhasználók és a podcast készítők növekvő igénye miatt, mondta.
„Ez az egyik legkeresettebb funkció a készítők részéről,” mondja Cave. „Ezt kérték tőlünk.”
Az Apple útja a podcast átiratokhoz egy másik funkció bővítésével kezdődött: az indexeléssel. Ez egy közös eredettörténet számos tech cégnél, mint az Amazon és a Yahoo – ami keresőeszközként indul, az teljes átirati kezdeményezéssé fejlődik. Az Apple először 2018-ban telepített szoftvert, amely felismerheti a podcastban elhangzott konkrét szavakat.
„Amit akkor tettünk, az az volt, hogy egyetlen sort kínáltunk az átiratból, hogy kontextust adjunk a felhasználóknak, amikor valami konkrét dologra keresnek,” emlékszik vissza Cave. „Az elmúlt hét évben számos különböző dolgot tettünk, amelyek mind összeálltak ebbe az [átirat] funkcióba.”
Cave szerint az évek fejlesztésének egyik nagy akadálya az volt, hogy biztosítsák a magas szintű teljesítményt, megjelenítést és pontosságot. Számos nagy előrelépés az Apple más részlegeinél végzett hozzáférhetőségi innovációkból származott.
„Ebben az esetben az Apple Books olvasási és az Apple Music dalszöveg funkcióiból tanult legjobbakat vettük alapul,” mondja Herrlinger. Az Apple Podcast átiratok időzített, szó szerinti kiemeléseket kölcsönöznek az Apple Music-tól, és az Apple Books betűtípusát és kontrasztos színvilágát használják a látássérültek számára.
Az Apple megpróbálta pótolni a késedelmet az átirat funkció kiadásában azzal, hogy szélesebb körű funkciót kínál, mint versenytársai. Az Amazon Music 2021 óta kínál automatikusan generált átiratokat podcastokhoz, de ezek csak saját eredeti programjaikra és néhány népszerű műsorra érhetők el, a feliratok blokk szövegként jelennek meg, nem szó szerinti kiemelésekkel. A Spotify 2023 szeptemberében kiadott egy átirat funkciót, amely tartalmazza a szó szerinti kiemeléseket, de ez csak a Spotify eredeti műsoraira és az ott hosztolt műsorokra érhető el.
Az Apple és a Spotify közötti zene- és podcast streaming háborúban a Spotify elrontotta egy AI-alapú fordító eszköz tavalyi bevezetését, amely állítólag több podcastot kínált volna franciául, németül és spanyolul. A cég látszólag nem teljesítette az akkor tett konkrét ígéreteit. Jelenleg úgy tűnik, hogy a streaming szolgáltatás csak spanyol fordításokat kínál – és főként csak egy podcasthoz: a Lex Fridman Podcasthoz. A bejelentéskor a Spotify számos podcastot említett, amelyek részei voltak a fordítási programjuknak – mint például a The Rewatchables és Trevor Noah’s What Now? – amelyek kilenc hónappal később nem rendelkeznek angol nyelven kívüli átiratokkal. A Spotify nem kívánt nyilatkozni, amikor megkérdezték ezekről az eltérésekről.
Az Apple podcast alkalmazása minden új feltöltött epizódot átír. „Minden műsorra meg akartuk csinálni, így nem csak egy szűk szeletre korlátozódik a katalógus,” mondja Cave. „Nem lenne megfelelő számunkra, hogy önkényes korlátot szabjunk arra, hogy hány műsor kapja meg ezt a funkciót … Fontosnak tartjuk ezt hozzáférhetőségi szempontból, mert azt akarjuk, hogy az emberek elvárják, hogy az átiratok elérhetők legyenek mindenhez, amit interakcióba lépnek.”
Cave hozzáteszi: „Idővel az egész epizód könyvtár át lesz írva.” Azonban azt mondja, hogy az Apple prioritást élvez az új tartalom átiratai számára, és nem kívánta megmondani, mikor kerülhet sor a régi katalógusok átiratára.
A fogyatékossági aktivisták és felhasználók elmondták, hogy elhiszik az Apple történetét, miszerint a cég azon dolgozott, hogy jól csinálja, ahelyett, hogy rossz terméket dobna piacra, bár lemaradt a versenytársak mögött. Azt mondták, inkább várnak a megfelelő termékre, mint hogy egy rossz hozzáférhetőségi projektet sietve dobjanak piacra.
„Tisztelem ezt. Azok a feliratok és átiratok, amelyek pontatlanok, egyszerűen nem érik el a célt,” mondja Shelburne.
„Le voltam nyűgözve, hogy mennyire pontos volt,” mondja Larry Goldberg, egy média- és technológiai hozzáférhetőségi úttörő, aki megalkotta az első zárt feliratozó rendszert a mozik számára. Az automatikus átirat hűsége az, ami régóta hiányzott, teszi hozzá. „Javult, jobb lett … de vannak idők, amikor nagyon rossz.”
Goldberg és más szakértők a YouTube automatikusan generált zárt feliratozó eszközére mutattak, amely 2009 óta elérhető, mint egy alacsony színvonalú, sietve piacra dobott termékre. Bár a YouTube azt mondja, hogy a feliratai jelentős frissítést kaptak 2023-ban, az eszköz az évek során gyakran kritizálták pontatlansága miatt. Néhány kritikus „craptions”-nek nevezte – amikor az eszköz olyan szavakat téveszt, mint a „concealer” (korektor) „zebra” és a „wedding” (esküvő) „lady” (hölgy) helyett.
Goldberg emlékszik, hogy megdöbbent egy kolléga reakcióján, miközben a megbízhatatlan átiratok félreinformálási következményeiről beszéltek: jobb, mint a semmi. „Ez a minőségi mércéd? Jobb, mint a semmi?” Goldberg mondta. „Nem, ez egyszerűen nem elég jó.”
Amellett, hogy biztosítsák, hogy az átiratok a lehető legpontosabban rögzítsék a beszédet, Cave az Apple-nél azt mondja, hogy sok munka ment abba, hogy a szoftvert arra képezzék, hogy bizonyos dolgokat kizárjon is. „Azt is szeretnénk, hogy élvezet legyen olvasni … Ez azt jelenti, hogy csökkenteni akartuk a töltelékszavak, mint az ‘ums’ és ‘ahs’ relatív fontosságát.”
Azoknak a podcast készítőknek, akik szeretnék, ha ezek a vokális diszfluenciák is átíródnának, az Apple azt mondja, hogy egyedi átiratot kell feltölteniük.
Az Apple munkatársai már most észreveszik, hogy az átirat eszközt számos meglepő célra használják. „Sok felhasználót látunk, akik az átiratokkal foglalkoznak a nyelvtanulás területén,” mondja Cave, megjegyezve, hogy az Apple Podcast átiratok támogatják az angol, spanyol, francia és német nyelvű podcastokat. „Gyakran találjuk, hogy amikor a margókra építünk, jobb terméket készítünk a tömegek számára,” mondja Herrlinger. „Más közösségek is megtalálják ezeket a funkciókat, és olyan módon használják őket, ahol tudjuk, hogy ez másoknak is hasznos lehet.”
Goldberg, a hozzáférhetőségi szakértő, azt szeretné látni, hogy más platformok is átvegyék az Apple megközelítését az átiratokhoz. Az ő álma az, hogy több cég kezdje el ugyanolyan prioritással kezelni a podcast átiratokat, mint a videó tartalmakat. „Régebben úgy hivatkoztam a munkámra, mint a fő könyörgő tiszt. ‘Kérem, kérem, tegyenek feliratokat a videóikra, kérem!’ Nem többé. Ó, nem. Mindenki ezt csinálja,” mondta, utalva a munkájára, amikor megalapította a National Center for Accessible Media-t a bostoni WGBH rádióállomásnál. Azt mondja, hogy most az a norma, hogy „egyszerűen nem teszel fel videókat online feliratok nélkül.” Reméli, hogy a podcastok is követik ezt a példát.
Wong, a Rhodes ösztöndíjas, szintén dicséri az Apple Podcasts átirat funkcióját – de lát néhány területet, ahol javításra szorul. Néhány aggálya van az eszköz komplex és egyedi kifejezések felismerésével kapcsolatban. „Mivel automatikusan generált, előfordulhatnak hibák a nagyon rossz név írásokban és a nagyon nehéz tudományos kifejezésekben,” mondja Wong. Az Apple elismeri, hogy a jobb névfelismerés már a radarjukon van, és azt tervezi, hogy további nyelvekre terjeszti ki a szolgáltatást.