Elindult a Midjourney képelemző szolgáltatása

Ma reggel elindult a Midjourney képelemző szolgáltatása. A szolgáltatás a Midjourney Discord szerverén érhető el, és a /describe paranccsal használható. Egyszerűen csak be kell írni a parancsot, majd feltölthetünk vagy drag-and-drop módszerrel behúzhatunk egy tetszőleges képet a számítógépünkről, vagy telefonunkról.

A Midjourney képes szinte azonnal reagálni a képekre, és négy szöveges kimenetet (választ) ad. Egyik próbánk során például egy budapesti taxiról küldtünk be képet. A rendszer pontosan elemezte a képet, még azt is felismerte, hogy az autóban nincs sofőr. A harmadik válaszában pedig rámutatott, hogy elektromos taxiról van szó.

Hirdetés:

A Midjourney azt is tudja, hogy ez egy Kia, bár a típust nem találta el

A válaszok prompt jellegűek, vagyis a rendszer a kép alapján generál válaszokat. Ha szeretnénk, a kép alatt kiválaszthatjuk, melyik prompt alapján kívánunk újabb képet generálni. Az eredményt a következő sorban jeleníti meg a Midjourney.

Négy sárga Kia autót generált, A rendszámban X-ekkel

Az első benyomások alapján úgy tűnik, hogy a szolgáltatás jól használható és könnyen érthető. Azonban további tesztelésre van szükség annak érdekében, hogy megbizonyosodjunk a rendszer valóban megállja a helyét a mindennapi használat során. A Midjourney képelemző szolgáltatása ígéretes újításnak tűnik, ami széles körben hasznos lehet a képek elemzésében és értelmezésében.

 

Vélemény, hozzászólás?