Google bemutatta a Gemma 3-at: Az új nyílt AI modellek zászlóshajója
Google nemrégiben elindította a Gemma 3-at, a legújabb változatát nyílt AI modellcsaládjának, amelynek célja, hogy új mércét állítson az AI elérhetősége terén. A Gemma 3 a cég Gemini 2.0 modelljeinek alapjaira épül, és úgy lett megtervezve, hogy könnyű, hordozható és alkalmazkodóképes legyen, lehetővé téve a fejlesztők számára, hogy AI alkalmazásokat hozzanak létre széleskörű eszközökön.
A kiadás időzítése különösen figyelemre méltó, hiszen a Gemma első születésnapja után történt, amelyet lenyűgöző elfogadási mutatók kísérnek. A Gemma modellek már több mint 100 millió letöltést értek el, és több mint 60,000 közösség által épített variánst generáltak. Ezt az ökoszisztémát „Gemmaverse”-nak nevezik, amely egy virágzó közösséget jelez, amely az AI demokratizálására törekszik.
„A Gemma nyílt modellek családja alapvető elkötelezettségünkre épül, hogy hasznos AI technológiát tegyünk elérhetővé” – mondta Google.
A Gemma 3 főbb jellemzői és képességei
A Gemma 3 modellek különböző méretekben érhetők el – 1B, 4B, 12B és 27B paraméterekkel – lehetővé téve a fejlesztők számára, hogy a specifikus hardver- és teljesítményigényeikhez legjobban illeszkedő modellt válasszanak. Ezek a modellek gyorsabb végrehajtást ígérnek, még mérsékelt számítástechnikai beállítások mellett is, anélkül, hogy a funkciót vagy a pontosságot feláldoznák.
Néhány kiemelkedő jellemzője a Gemma 3-nak:
- Egységes gyorsító teljesítmény: A Gemma 3 új mércét állít fel az egységes gyorsítós modellek között. Az LMArena ranglistán végzett előzetes emberi preferencia értékelések alapján a Gemma 3 felülmúlta riválisait, köztük a Llama-405B-t és a DeepSeek-V3-at.
- Többnyelvű támogatás 140 nyelven: A Gemma 3 140 nyelv előképzett képességeivel rendelkezik, lehetővé téve a fejlesztők számára, hogy alkalmazásokat hozzanak létre, amelyek a felhasználóik anyanyelvén kapcsolódnak.
- Fejlett szöveg- és vizuális elemzés: A Gemma 3 fejlett szöveg-, kép- és rövid videóérvelési képességekkel rendelkezik, amely lehetővé teszi interaktív és intelligens alkalmazások készítését.
- Kibővített kontextusablak: A Gemma 3 128 ezer tokenes kontextusablakkal bír, ami ideálissá teszi nagy adathalmazok elemzésére.
- Funkcióhívás a munkafolyamat automatizálásához: A Gemma 3 funkcióhívás támogatása lehetővé teszi a fejlesztők számára, hogy strukturált kimeneteket használjanak a folyamatok automatizálásához.
- Quantált modellek a könnyű hatékonyságért: A Gemma 3 hivatalos quantált verziókat vezetett be, amelyek jelentősen csökkentik a modell méretét, miközben megőrzik a kimenetek pontosságát.
Az AI felelősségteljes fejlesztése
„Úgy gondoljuk, hogy a nyílt modellek gondos kockázatértékelést igényelnek, és megközelítésünk az innovációt a biztonsággal egyensúlyba hozza” – magyarázta Google. A Gemma 3 csapata szigorú irányítási politikákat alkalmazott, hogy a modellt etikai irányelvekkel összhangba hozza.
A „Gemmaverse” nem csupán egy technikai ökoszisztéma, hanem egy közösség által vezérelt mozgalom is. Az AI Singapore SEA-LION v3, az INSAIT BgGPT és a Nexa AI OmniAudio projektjei tanúskodnak az ökoszisztémán belüli együttműködés erejéről.
Érdekes tény: A Gemma 3 nyílt modellek középpontjában álló közösségi kezdeményezések célja, hogy az AI fejlesztésekkel kapcsolatos kutatásokhoz 10,000 dollár értékű Google Cloud krediteket biztosítsanak a kutatók számára.
Források: AI News, Google