Új Hangsúly a Beszélgetésen: A Google Gemini Live
A Google a héten számos új hardvert jelentett be, beleértve a Pixel 9 okostelefonokat és az új vezeték nélküli fülhallgatókat. Az összes csillogó kütyü mögött a Google Gemini mesterséges intelligencia asszisztense áll. Ez a chatbot már az év elején debütált, és most a Pixel 9 sorozat alapértelmezett asszisztense, amely már milliók Android telefonján elérhető világszerte. De itt van egy új módszer, amellyel kapcsolatba léphetünk ezzel a chatbot-tal: a Gemini Live.
A Gemini Live a Google válasza az OpenAI GPT-4o-ra, lehetőséget adva arra, hogy természetesen beszélgessünk az asszisztenssel, hasonlóan két ember közötti normális beszélgetéshez (vagy legalábbis ez a cél). Jelenleg angol nyelven érhető el a Gemini Advanced előfizetők számára (havi 20 dollárért), és a Gemini alkalmazás jobb alsó sarkában található kis Live gombra kattintva érhető el. Az iOS alkalmazásra és más nyelvekre a következő hetekben érkezik.
Az Interaktív Élmény
Sissie Hsiao, a Google Gemini élményeiért felelős alelnöke elmondta a WIRED-nek, hogy ez a chatbot nem csupán egy felmelegített Google Asszisztens. Ehelyett egy olyan felület, amelyet teljesen újraépítettek generatív mesterséges intelligencia segítségével. „Az évek során, amíg az Asszisztenst építettük, két dolgot kértek tőlünk a felhasználók” – mondta Hsiao. „Az első, hogy folyékonyabb és természetesebb asszisztenst szeretnének – szeretnék természetesen beszélni vele anélkül, hogy meg kellene változtatniuk a beszédstílusukat. A második pedig, hogy képesebb legyen; segíteniük kell az életük problémáinak megoldásában, nem csak egyszerű feladatokban.”
Az Élő Beszélgetés
Ha elindítjuk a Gemini Live-ot, egy üres képernyőt látunk, amelyből egy éteri fény ragyog fel az aljáról. Kezdhetünk beszélgetni az asszisztenssel akkor is, ha a telefonunk zárva van, és a képernyő ki van kapcsolva. A Google új Pixel Buds Pro 2 vezeték nélküli fülhallgatóin keresztül is elérhetjük, így kéz nélkül beszélgethetünk, miközben a telefonunk a táskánkban van. Tíz különböző hang közül választhatunk, amelyek eltérő tónusúak, akcentusúak és stílusúak. Amikor befejezzük a beszélgetést, láthatjuk az egész beszélgetés átiratát, amelyhez bármikor hozzáférhetünk a Gemini alkalmazásban.
Ellentétben a régi hangasszisztensekkel, a Gemini Live lehetővé teszi, hogy megszakítsuk a beszélgetést anélkül, hogy megzavarnánk az egész élményt. Ezen kívül a Google tervezi, hogy a Gemini Live-ot összekapcsolja más alkalmazásokkal bővítmények révén, bár sok közülük még nem érhető el. Például megkérdezhetjük a Gemini Live-t, hogy jelenítse meg egy bulira szóló meghívót a Gmailben, és kérdezhetünk az időpontról és a helyszínről, ahelyett, hogy magunk keresgélnénk.
Az év végén a Google bevezeti a Gemini Live-ot a Project Astra-val, egy számítógépes látástechnológiai megoldással, amelyet a fejlesztői konferenciáján mutattak be. Ez lehetővé teszi, hogy a telefonunk kameráját használva valós időben kérdezzünk a látható tárgyakról a valóságban. Képzeljük el, hogy elhaladunk egy koncertplakát mellett, és megkérdezzük, hogy tárolja el a dátumokat a naptárunkban, és állítson be egy emlékeztetőt a jegyvásárlásra.
Az AI technológia folyamatos fejlődése lehetővé teszi, hogy a felhasználók interaktívabb módon fedezzék fel a világot, és olyan tapasztalatokat szerezzenek, amelyekre korábban nem volt lehetőségük.
Érdekes tény: A mesterséges intelligencia alkalmazásainak egyik legnagyobb előnye, hogy képes folyamatosan tanulni a felhasználói interakciókból, így egyre inkább személyre szabott válaszokat adhat.
Források: WIRED