Az xAI Grok chatbotja most már képes a valós idejű látásra
Az xAI kedden bejelentette a Grok Vision elindítását, amely lehetővé teszi a felhasználók számára, hogy a telefonjuk kamerájával mutassanak tárgyakra, jelekre és dokumentumokra, majd kérdéseket tegyenek fel róluk. Ez a funkció hasonló a Google Gemini és a ChatGPT által kínált valós idejű látás funkciókhoz.
A Grok Vision nem csupán egy újabb chatbot, hanem egy fejlett tudásbázis, amely képes azonnal reagálni a felhasználók kérdéseire, miközben a kamera által rögzített látványt elemzi. Ez a fejlesztés jelentős lépést jelent a mesterséges intelligencia interaktív és használható képességeinek terén.
A Grok Vision segítségével a felhasználók például megkérdezhetik, hogy mi található egy bolt polcán vagy mit jelent egy idegen nyelvű tábla. Az AI mögött álló algoritmusok képesek az objektumok és szövegek gyors azonosítására, így a felhasználók azonnali válaszokat kaphatnak.
Ez a technológia nemcsak a mindennapi életet könnyíti meg, hanem új lehetőségeket nyit meg a tanulás és a felfedezés terén is. A Grok Vision révén a felhasználók aktívan bevonódhatnak a környezetük felfedezésébe, miközben a mesterséges intelligencia segítségével mélyebb megértésre tehetnek szert.
Egy érdekesség: A mesterséges intelligencia alapú képfelismerés már több mint 50 éve folytatódik, de az utóbbi években a mélytanulás technikáknak köszönhetően jelentős előrelépések történtek a pontosság és a gyorsaság terén.
Források: xAI hivatalos bejelentése, Google Gemini és ChatGPT dokumentáció.