Gemma 3: a Google bemutatja legújabb nyílt mesterséges intelligencia modelljeit.

Google bemutatta a Gemma 3-at: Az új nyílt AI modellek zászlóshajója

Google nemrégiben elindította a Gemma 3-at, a legújabb változatát nyílt AI modellcsaládjának, amelynek célja, hogy új mércét állítson az AI elérhetősége terén. A Gemma 3 a cég Gemini 2.0 modelljeinek alapjaira épül, és úgy lett megtervezve, hogy könnyű, hordozható és alkalmazkodóképes legyen, lehetővé téve a fejlesztők számára, hogy AI alkalmazásokat hozzanak létre széleskörű eszközökön.

A kiadás időzítése különösen figyelemre méltó, hiszen a Gemma első születésnapja után történt, amelyet lenyűgöző elfogadási mutatók kísérnek. A Gemma modellek már több mint 100 millió letöltést értek el, és több mint 60,000 közösség által épített variánst generáltak. Ezt az ökoszisztémát „Gemmaverse”-nak nevezik, amely egy virágzó közösséget jelez, amely az AI demokratizálására törekszik.

„A Gemma nyílt modellek családja alapvető elkötelezettségünkre épül, hogy hasznos AI technológiát tegyünk elérhetővé” – mondta Google.

A Gemma 3 főbb jellemzői és képességei

A Gemma 3 modellek különböző méretekben érhetők el – 1B, 4B, 12B és 27B paraméterekkel – lehetővé téve a fejlesztők számára, hogy a specifikus hardver- és teljesítményigényeikhez legjobban illeszkedő modellt válasszanak. Ezek a modellek gyorsabb végrehajtást ígérnek, még mérsékelt számítástechnikai beállítások mellett is, anélkül, hogy a funkciót vagy a pontosságot feláldoznák.

Néhány kiemelkedő jellemzője a Gemma 3-nak:

  • Egységes gyorsító teljesítmény: A Gemma 3 új mércét állít fel az egységes gyorsítós modellek között. Az LMArena ranglistán végzett előzetes emberi preferencia értékelések alapján a Gemma 3 felülmúlta riválisait, köztük a Llama-405B-t és a DeepSeek-V3-at.
  • Többnyelvű támogatás 140 nyelven: A Gemma 3 140 nyelv előképzett képességeivel rendelkezik, lehetővé téve a fejlesztők számára, hogy alkalmazásokat hozzanak létre, amelyek a felhasználóik anyanyelvén kapcsolódnak.
  • Fejlett szöveg- és vizuális elemzés: A Gemma 3 fejlett szöveg-, kép- és rövid videóérvelési képességekkel rendelkezik, amely lehetővé teszi interaktív és intelligens alkalmazások készítését.
  • Kibővített kontextusablak: A Gemma 3 128 ezer tokenes kontextusablakkal bír, ami ideálissá teszi nagy adathalmazok elemzésére.
  • Funkcióhívás a munkafolyamat automatizálásához: A Gemma 3 funkcióhívás támogatása lehetővé teszi a fejlesztők számára, hogy strukturált kimeneteket használjanak a folyamatok automatizálásához.
  • Quantált modellek a könnyű hatékonyságért: A Gemma 3 hivatalos quantált verziókat vezetett be, amelyek jelentősen csökkentik a modell méretét, miközben megőrzik a kimenetek pontosságát.

Az AI felelősségteljes fejlesztése

„Úgy gondoljuk, hogy a nyílt modellek gondos kockázatértékelést igényelnek, és megközelítésünk az innovációt a biztonsággal egyensúlyba hozza” – magyarázta Google. A Gemma 3 csapata szigorú irányítási politikákat alkalmazott, hogy a modellt etikai irányelvekkel összhangba hozza.

A „Gemmaverse” nem csupán egy technikai ökoszisztéma, hanem egy közösség által vezérelt mozgalom is. Az AI Singapore SEA-LION v3, az INSAIT BgGPT és a Nexa AI OmniAudio projektjei tanúskodnak az ökoszisztémán belüli együttműködés erejéről.

Érdekes tény: A Gemma 3 nyílt modellek középpontjában álló közösségi kezdeményezések célja, hogy az AI fejlesztésekkel kapcsolatos kutatásokhoz 10,000 dollár értékű Google Cloud krediteket biztosítsanak a kutatók számára.

Források: AI News, Google