Fedezd Fel a Gemini Live Titkait: Hogyan Használhatod Ki a Lehetőségeit a Sikeres Pénzügyi Stratégiához?

Új Hangsúly a Beszélgetésen: A Google Gemini Live

A Google a héten számos új hardvert jelentett be, beleértve a Pixel 9 okostelefonokat és az új vezeték nélküli fülhallgatókat. Az összes csillogó kütyü mögött a Google Gemini mesterséges intelligencia asszisztense áll. Ez a chatbot már az év elején debütált, és most a Pixel 9 sorozat alapértelmezett asszisztense, amely már milliók Android telefonján elérhető világszerte. De itt van egy új módszer, amellyel kapcsolatba léphetünk ezzel a chatbot-tal: a Gemini Live.

A Gemini Live a Google válasza az OpenAI GPT-4o-ra, lehetőséget adva arra, hogy természetesen beszélgessünk az asszisztenssel, hasonlóan két ember közötti normális beszélgetéshez (vagy legalábbis ez a cél). Jelenleg angol nyelven érhető el a Gemini Advanced előfizetők számára (havi 20 dollárért), és a Gemini alkalmazás jobb alsó sarkában található kis Live gombra kattintva érhető el. Az iOS alkalmazásra és más nyelvekre a következő hetekben érkezik.

Az Interaktív Élmény

Sissie Hsiao, a Google Gemini élményeiért felelős alelnöke elmondta a WIRED-nek, hogy ez a chatbot nem csupán egy felmelegített Google Asszisztens. Ehelyett egy olyan felület, amelyet teljesen újraépítettek generatív mesterséges intelligencia segítségével. „Az évek során, amíg az Asszisztenst építettük, két dolgot kértek tőlünk a felhasználók” – mondta Hsiao. „Az első, hogy folyékonyabb és természetesebb asszisztenst szeretnének – szeretnék természetesen beszélni vele anélkül, hogy meg kellene változtatniuk a beszédstílusukat. A második pedig, hogy képesebb legyen; segíteniük kell az életük problémáinak megoldásában, nem csak egyszerű feladatokban.”

Az Élő Beszélgetés

Ha elindítjuk a Gemini Live-ot, egy üres képernyőt látunk, amelyből egy éteri fény ragyog fel az aljáról. Kezdhetünk beszélgetni az asszisztenssel akkor is, ha a telefonunk zárva van, és a képernyő ki van kapcsolva. A Google új Pixel Buds Pro 2 vezeték nélküli fülhallgatóin keresztül is elérhetjük, így kéz nélkül beszélgethetünk, miközben a telefonunk a táskánkban van. Tíz különböző hang közül választhatunk, amelyek eltérő tónusúak, akcentusúak és stílusúak. Amikor befejezzük a beszélgetést, láthatjuk az egész beszélgetés átiratát, amelyhez bármikor hozzáférhetünk a Gemini alkalmazásban.

Ellentétben a régi hangasszisztensekkel, a Gemini Live lehetővé teszi, hogy megszakítsuk a beszélgetést anélkül, hogy megzavarnánk az egész élményt. Ezen kívül a Google tervezi, hogy a Gemini Live-ot összekapcsolja más alkalmazásokkal bővítmények révén, bár sok közülük még nem érhető el. Például megkérdezhetjük a Gemini Live-t, hogy jelenítse meg egy bulira szóló meghívót a Gmailben, és kérdezhetünk az időpontról és a helyszínről, ahelyett, hogy magunk keresgélnénk.

Az év végén a Google bevezeti a Gemini Live-ot a Project Astra-val, egy számítógépes látástechnológiai megoldással, amelyet a fejlesztői konferenciáján mutattak be. Ez lehetővé teszi, hogy a telefonunk kameráját használva valós időben kérdezzünk a látható tárgyakról a valóságban. Képzeljük el, hogy elhaladunk egy koncertplakát mellett, és megkérdezzük, hogy tárolja el a dátumokat a naptárunkban, és állítson be egy emlékeztetőt a jegyvásárlásra.

Az AI technológia folyamatos fejlődése lehetővé teszi, hogy a felhasználók interaktívabb módon fedezzék fel a világot, és olyan tapasztalatokat szerezzenek, amelyekre korábban nem volt lehetőségük.

Érdekes tény: A mesterséges intelligencia alkalmazásainak egyik legnagyobb előnye, hogy képes folyamatosan tanulni a felhasználói interakciókból, így egyre inkább személyre szabott válaszokat adhat.

Források: WIRED