29. 2. 2024 14:10 | Novinky | autor: Adam Homola

Výzkumníci z Google DeepMind, kteří stojí z velké části (mimo jiné) za generativní umělou inteligencí Gemini, představili novinku Genie. Model generativní umělé inteligence schopný vytvářet 2D hry z obrázků, animací, fotek či textových popisků.

Jde o další z celé řady průlomů a zásadních pokroků, které se kolem generativní umělé inteligence v posledních měsících a letech dějí. Od ChatGPT (text), přes DALL-E či Midjourney (obrázky), až po Sora a Genie (videa/hry).

Genie využívá více než 200 000 hodin videí, na kterých si natrénoval některé základní prvky herního „designu“ a dokáže tak rozlišit interaktivní prvky - hlavní postavičku, pozadí, plošinky a další věci. V současné prvotní fázi jde pouze o představení modelu, sami si s ním zatím ještě nic nevygenerujete a samozřejmě, že výsledek vizuálně vypadá hrozně. Pointou ale není srovnávat aktuální stav Genie s reálnými hrami.

Pro DeepMind jde o vůbec první výkop směrem k tvorbě her na základě textového zadání či obrázku. Na webu DeepMind se můžete podívat hned na několik gifů, které ukazují ještě nedávno těžko uvěřitelné možnosti Genie – včetně faktu, že budete moct nakreslit na papír hrubý koncept herní scény, vyfotit ho, obrázek použít jako zadání a hned máte rozpohybovanou postavu v interaktivním prostředí. Aniž byste museli cokoliv programovat, a dokonce aniž byste museli specificky označovat, co je postava, že má třeba skákat, a co jsou plošinky. Genie by si měl být jednoduše schopen „domyslet“, co je co a sám scénu automaticky rozpohybovat tak, aby působila jako hra.

Potenciál pro vývoj i celý herní průmysl je tady neskutečný – modely jako Genie či Sora se mohou ze začátku používat například k rychlému prototypování herních prvků. Dá se ale předpokládat, že nebude trvat dlouho a každý si bude moct z pár obrázků a textových promptů vytvořit vlastní hru.

Genie tak představuje nejen prvopočátek nového milníku ve vývoji her, ale má také důsledky pro výzkum a výcvik umělé inteligence. Tím, že generuje nekonečné množství interaktivních prostředí, nabízí platformu pro trénink agentů AI v rozmanitých scénářích a ve výsledku bude moct být použit například i v robotice, jak uvádí DeepMind na webu.