Meta Bemutatja a Llama 3-at: A Generatív AI Forradalma
Április 18-án a Meta bemutatta legújabb generatív AI modelljét, a Llama 3-at, amely számos szabványos AI benchmark teszten felülmúlja a GPT-4-et. A Llama 3 egy nagy nyelvi modell (LLM), amelyet arra terveztek, hogy természetes nyelvi válaszokat adjon különböző kérdésekre, és számos felhasználási területen bizonyította hatékonyságát, mint például ötletelés, kreatív írás, kódolás, dokumentumok összefoglalása és kérdések megválaszolása egy adott személyiség vagy karakter hangján.
Llama 3 Változatai
A teljes Llama 3 modell négy változatban érhető el:
- 8 milliárd paraméter előre betanítva
- 8 milliárd paraméter instrukcióval finomhangolva
- 70 milliárd paraméter előre betanítva
- 70 milliárd paraméter instrukcióval finomhangolva
Ezek a variánsok böngészőben vagy a Meta különféle platformjain, mint a Facebook, Instagram, WhatsApp és Messenger AI funkciói révén használhatók. A modell maga letölthető a Metától vagy nagyvállalati felhőplatformokról.
A Llama 3 Elérhetősége és Platformjai
A Llama 3 április 18-án jelent meg a Google Cloud Vertex AI, IBM watsonx.ai és más nagy LLM hosting platformokon. Az AWS április 23-án csatlakozott, hozzáadva a Llama 3-at az Amazon Bedrockhoz. Április 29-től a Llama 3 a következő platformokon érhető el:
- Databricks
- Hugging Face
- Kaggle
- Microsoft Azure
- NVIDIA NIM
Az AMD, AWS, Dell, Intel, NVIDIA és Qualcomm hardverplatformjai is támogatják a Llama 3-at.
Llama 3 Nyílt Forráskódú?
A Llama 3 nyílt forráskódú, ahogy a Meta többi LLM-je is. Mark Zuckerberg, a Meta alapítója és vezérigazgatója egy júliusi híradásban részletezte ezt a filozófiát. Bár vita folyik arról, hogy egy nagy nyelvi modell kódjának vagy súlyainak mekkora részét kell nyilvánossá tenni ahhoz, hogy nyílt forráskódúnak minősüljön, üzleti célokra a Meta nyitottabb betekintést kínál a Llama 3-ba, mint versenytársai.
A Llama 3 Fejlesztései a Llama 2-höz Képest
A Meta új tokenizálót adott a Llama 3-hoz, amely sokkal hatékonyabban kódolja a nyelvet. A Llama 3 tréning készletének mérete hétszerese a Llama 2 tréning készletének, beleértve négyszer annyi kódot. A Meta új hatékonysági eljárásokat alkalmazott a Llama 3 előképzéséhez és instrukciós finomhangolásához.
A Meta célja, hogy hozzáadjon több nyelvet a Llama 3-hoz, bővítse a kontextus ablakot, és általánosan növelje a modell képességeit. A Meta egy 400 milliárd paraméteres modellt is fejleszt, amely segíthet a Llama 3 következő generációjának alakításában.
Érdekes tény: A generatív AI-k, mint a Llama 3, képesek akár több millió szót is feldolgozni másodpercek alatt, ami nagyságrendekkel gyorsabb, mint az emberi agy szövegfeldolgozási sebessége.
Források: Meta, TechRepublic