Xai grok chatbotja most már ‘látja’ a körülötte lévő világot.

Az xAI Grok chatbotja most már képes a valós idejű látásra

Az xAI kedden bejelentette a Grok Vision elindítását, amely lehetővé teszi a felhasználók számára, hogy a telefonjuk kamerájával mutassanak tárgyakra, jelekre és dokumentumokra, majd kérdéseket tegyenek fel róluk. Ez a funkció hasonló a Google Gemini és a ChatGPT által kínált valós idejű látás funkciókhoz.

A Grok Vision nem csupán egy újabb chatbot, hanem egy fejlett tudásbázis, amely képes azonnal reagálni a felhasználók kérdéseire, miközben a kamera által rögzített látványt elemzi. Ez a fejlesztés jelentős lépést jelent a mesterséges intelligencia interaktív és használható képességeinek terén.

A Grok Vision segítségével a felhasználók például megkérdezhetik, hogy mi található egy bolt polcán vagy mit jelent egy idegen nyelvű tábla. Az AI mögött álló algoritmusok képesek az objektumok és szövegek gyors azonosítására, így a felhasználók azonnali válaszokat kaphatnak.

Ez a technológia nemcsak a mindennapi életet könnyíti meg, hanem új lehetőségeket nyit meg a tanulás és a felfedezés terén is. A Grok Vision révén a felhasználók aktívan bevonódhatnak a környezetük felfedezésébe, miközben a mesterséges intelligencia segítségével mélyebb megértésre tehetnek szert.

Egy érdekesség: A mesterséges intelligencia alapú képfelismerés már több mint 50 éve folytatódik, de az utóbbi években a mélytanulás technikáknak köszönhetően jelentős előrelépések történtek a pontosság és a gyorsaság terén.

Források: xAI hivatalos bejelentése, Google Gemini és ChatGPT dokumentáció.