2023.06.01. 06:00
Ez gamerforradalom: a játékos saját hangján szólal meg a videójátékban
A virtuális karakterek váratlanul életre kelnek: az NVIDIA ACE for Games bedobta a játékosoknak a generatív mesterséges intelligencia erejét. Vegyük úgy – némi túlzással –, mintha egy ChatGPT-t ötvöznének a videójátékba.
Forrás: Nvidia
A tajpeji Computex 2023 kiállításon az Nvidia vezérigazgatója, Jensen Huang meghökkentette a világot azzal, hogy bemutatta egy játékuk demójával, milyen az, mikor a csúcstechnikával készült videó összekarol a mesterséges intelligenciával. Látszólag apróságról van szó. A videójáték ezen részében a gamer besétál egy lélegzetelállítóan részletes képi világú cyberpunk ramen boltba, ahol pár szót beszélget a tulajdonossal.
De a lényeg: ahelyett, hogy a játékos a gépen különböző opciókra kattintgatna, vagy lenyomna egy-két gombot az előre definiált reakció lefuttatására,
a saját hangján szólal meg, és a videójáték virtuális szereplője konkrét, jelen idejű választ ad a kérdéseire!
Ahányszor csak „találkoznak” a játékban, valós időben másról beszélgethet az emberi játékos és a virtuális szereplő.
Az alábbi demóban úgy 1:06-nál indul a különben nem túl épületes, de mégis játéktörténelmi jelentőségű társalgás, amelyben egy virtuális karakter a játékos természetes emberi beszédére reagál.
Íme a beszélgetés, amely úgy 1:06 körül indul a videón:
Játékos: Szia Jin, hogy vagy?
Jin: Sajnos, nem igazán jól.
Hogy-hogy?
Aggódom az itteni bűnözés miatt. Mostanában elvadult. A ramen boltom kereszttűzbe került.
Segíthetek?
Ha tenni akarsz valamit ez ellen, hallottam olyan pletykákat, hogy Kumon Aoki, a nagyhatalmú bűnöző okozza a káoszt a városban. Lehet, hogy ő az erőszak gyökere.
Beszélek vele. Hol találom?
Azt hallottam, hogy a város keleti oldalán lévő underground harci klubokban lóg. Próbáld ott.
Rendben, megyek.
Vigyázz, Kai.
Eddig a beszélgetés, ami sokféleképpen lejátszódhat, kérdezhetünk, mondhatunk mást, okosabbat, egyszerűbbet is – akárhogy, a játékos élőben belevonódik a történetbe.
Az NVIDIA ACE for Games úttörő fejlesztésként olyan valós idejű interakciókat vezet be, amelyekben a nem játszható karakterek (NPC-k) menet közben reagálnak az emberi beszédre. (Az NPC, Non-player character a videójátékokban a nem játszható karaktert jelenti.)
A mesterséges intelligencia felhasználásával az NPC-k valós idejű párbeszédet generálnak, dinamikus beszélgetéseket hoznak létre a játékosokkal. Ez új lehetőségeket nyit meg a gamerek és a virtuális karakterek közötti élethű és előre megírt forgatókönyv nélküli interakciókban, és olyan játékélményt nyújt, amit eddig csak sci-fi filmeken láthattunk.
A demóban az NPC-vel való beszélgetéshez az „NVIDIA NeMo”-t, egy nagyszabású nyelvi modellt használták, amely képes megtanulni az NPC hátterét, történetét stb. A modell a hangalapú beszélgetést automatikus beszédfelismerésre és szövegfelolvasásra alapozza. Ezt egy köztes szoftvercsomag teszi lehetővé, amely tartalmazza az NVIDIA Riva-t a hangok lejátszásához, és az NVIDIA Omniverse Audio2Facet, amely lehetővé teszi a karakterek arckifejezésének természetes változtatását a beszédükhöz és az adott helyzethez alkalmazkodva.
Az NVIDIA szerint az NVIDIA ACE egyszerre több karakterre is alkalmazható, így lehetséges lesz, hogy az NPC-k majd teljesen autonóm módon beszélgethessenek nem csak a játékosokkal, hanem egymással is.
Az Nvidia az AI fellendülésének köszönhetően 1 billió dolláros cég lett
Az Nvidia kedd reggel átmenetileg az 1 billió dolláros vállalatok elit klubjának tagja lett az Apple, a Microsoft, a Meta, az Amazon, a Google és társai mellett.
Tőzsdei záráskor a részvény árfolyama a 419 dolláros csúcs után 401,11 dollárra esett vissza. Ezzel az Nvidia részvényeinek értéke „mindössze” 992 milliárd dollár, ami egyelőre még kivette az 1 billiós klubból.
A cég legutóbbi negyedéves eredményjelentése három hónap alatt több mint 2 milliárd dollár nyereséget mutatott ki. Az Nvidia üzlete a világjárvány korai szakaszában lendült fel igazán a GPU-hiány miatt, ráadásul szintén akkoriban megugrott a kereslet a PC-s játékok és a kriptovaluta bányászata iránt. Ezek a piacok 2022-re visszaestek: mostani pazar növekedése elsősorban annak köszönhető, hogy a kép- és a szöveggeneráló mesterséges intelligencia-rendszerek mind Nvidia videókártyákon futnak, más gyártók csak botladoznak az új piacon.
A vezető játékfejlesztők és startupok már kihasználják az Nvidia generatív mesterséges intelligencia technológiáit. A GSC Game World például az Audio2Face-t alkalmazza a várva várt STALKER 2 Heart of Chernobyl játékban, a Fallen Leaf pedig karakterarc-animációhoz a Fort Solis című sci-fi thrillerében. A Charisma.ai szintén az Audio2Face-et dobja be az animáció vezérlésére a beszélgetési motorjában, lehetővé téve a virtuális karakterek használatát mesterséges intelligenciával.
Digitália
- Magyarul is beszélő, valódi robotkutyával találkozhatunk az ingyenes hazai eseményen
- Az otthoni rehabilitációt segíti a mesterséges intelligenciával működő hazai fejlesztés
- Nő lett Magyarország első űrorvosa
- Magyar nőket érintő Motherless-botrány: ezt tehetjük a lesifotók ellen
- Vakok újra látnak – hatalmasat lépett a Science Corporation