Genie di Google DeepMind ha creato il primo videogioco IA

Diciamoci la verità, anche se l’intelligenza artificiale aperta al pubblico è in giro da relativamente poco, già ci stiamo abituando a vedere materiale generato da essa, come foto, video e audio. C’è da notare, però, che questi sono contenuti comunque “passivi” rispetto a quello che il modello Genie di Google DeepMind è riuscito a fare. Infatti, questo strumento fa qualcosa di completamente diverso e che non si era mai visto prima: converte le immagini in ambienti interattivi e giocabili che possono essere facilmente creati, entrati e esplorati. Insomma, avete capito bene, parliamo del primo videogioco interamente generato dall’IA.

La pagina di annuncio di Genie di DeepMind, disponibile online, mostra diverse gif che raffigurano esempi di videogiochi di tipo platform generati da questo nuovo modello. Questi sono principalmente creati prendendo ispirazione da immagini statiche, come potrebbero essere disegni per bambini, fotografie del mondo reale, ma anche semplicemente creati da idee scritte e passate per un altro strumento alimentato dall’IA chiamato ImageGen2. Insomma, la novità è grande, però è comunque da considerare che questi sono prototipi, e che nelle gif non si notano tutte le limitazioni attuali del modello, che sono, però, citate nel documento di ricerca completo e disponibile sulla loro pagina ufficiale.

Nonostante, questi difetti, però, i ricercatori che hanno lavorato su questo progetto si ritengono comunque soddisfatti e fieri della loro creazione e credono molto nel potenziale di questo nuovo modello Genie. Non soltanto perché vogliono contribuire al mondo del gaming, ma anche perché queste funzioni di generazione di ambienti giocabili e interattivi, senza dover passare per i processi standard, è un’ottima prova di quanto si possa investire e migliorare l’apprendimento automatico dell’intelligenza artificiale. Questo tipo di apprendimento fa sì che l’IA analizzi e comprenda la progettazione dietro ad un prodotto ed una volta capito, possa riprodurlo da sola, utilizzando solo i dati che ha raccolto.

intelligenza artificiale-Rahul Pandit-Pexels.com

Ma capiamo bene come funziona questo Genie di Google DeepMind. A prima vista, potrebbe sembrare simile a un motore di gioco 2D, ma funziona in modo diverso. Invece di disegnare sprite (cioé, invece di creare solo i personaggi, oggetti, nemici, ed elementi grafici del gioco bidimensionalmente) e scrivere i vari codici per creare un gioco interattivo, Genie tratta le immagini di partenza come fotogrammi di un video e prevede come dovrebbe apparire il fotogramma successivo quando viene fornito un input specifico.

Per creare questo modello, Genie ha utilizzato un’enorme quantità di data, partendo da 200.000 ore di video di giochi platform online. Questi video sono stati, poi, filtrati fino a ottenere 30.000 ore di video standardizzati provenienti da centinaia di giochi 2D. I fotogrammi di questi video sono stati, poi, trasformati in un modello di 200 milioni di parametri, che sono valori numerici che il modello utilizza per imparare dai dati presentati. Per non portarla troppo alle lunghe… dopo questo processo, Genie sviluppa un modello di “azione latente” che può prevedere quali azioni interattive possono causare cambiamenti nel gioco, limitando le opzioni ad 8 per rendere il gioco più accessibile agli esseri umani. Dopo di ché, utilizza questo modello per creare un altro chiamato “modello di dinamica”, che analizza i fotogrammi del gioco e le azioni degli utenti per prevedere come dovrebbe apparire il prossimo fotogramma.

gaming-Alexander Kovalev-Pexels.com

Questo modello è stato preparato su un’enorme quantità di dati ed è totalmente diverso dai modelli precedenti poiché non richiede informazioni dettagliate ( come etichette di azione o descrizioni testuali) per funzionare, ma si basa invece sull’analisi dei fotogrammi dei giochi stessi! Dunque, è un processo totalmente rivoluzionario, che sicuramente avrà un impatto nel mondo del gaming e del coding.

Di fatto, non si era mai visto un programma in grado di creare giochi interattivi da immagini statiche senza bisogno di istruzioni dettagliate, ma che si basa, invece, solo sulle informazioni contenute nei fotogrammi dei giochi per capire come far funzionare il gioco.