Per la prima volta, un sistema di intelligenza artificiale è riuscito nell’impresa di raccogliere diamanti in Minecraft, uno dei videogiochi più popolari al mondo, senza che gli venisse mostrato come fare. Si chiama Dreamer, è stato sviluppato da Google DeepMind, e rappresenta un passo importante verso lo sviluppo di macchine capaci di generalizzare la conoscenza appresa in un contesto e applicarla a situazioni nuove.

Un’intelligenza che impara da sola in un mondo virtuale

“Dreamer segna un passo significativo verso sistemi di IA generali“, afferma Danijar Hafner, informatico di Google DeepMind a San Francisco. “Permette all’IA di comprendere l’ambiente fisico in cui si trova e di migliorarsi nel tempo, senza che un umano debba dirle esattamente cosa fare”. I risultati di questa ricerca sono stati pubblicati sulla rivista Nature il 2 aprile. Minecraft offre un banco di prova ideale per questo tipo di sistemi di intelligenza artificiale. Il gioco permette ai giocatori di esplorare un mondo virtuale 3D con vari tipi di terreni, dalle foreste alle montagne, dai deserti alle paludi. I giocatori utilizzano le risorse del mondo per creare oggetti e raccogliere materiali, tra cui i preziosi diamanti.

La caratteristica che rende Minecraft particolarmente interessante per i ricercatori è che ogni partita è unica. “Ogni volta che giochi, è un mondo nuovo generato casualmente“, spiega Hafner. “Devi davvero capire cosa hai davanti; non puoi semplicemente memorizzare una strategia specifica”.

Raccogliere un diamante in Minecraft è “un compito molto difficile”, secondo Jeff Clune dell’Università della British Columbia. Richiede una serie di passaggi complessi: trovare alberi e abbatterli per raccogliere legno, costruire un tavolo da lavoro, creare picconi di legno e poi di pietra, e così via fino ad assemblare gli strumenti corretti per raccogliere un diamante, che si trova sepolto in profondità.

Dal mondo virtuale a quello reale

A differenza di quanto tentato in passo, dove all’AI è stato mostrato cosa fare usando istruzioni dettagliate, oppure mostrandole migliaia di ore di video di gameplay, Dreamer è progettata per esplorare il gioco completamente in autonomia, utilizzando una tecnica di apprendimento per rinforzo. Identifica le azioni che probabilmente porteranno a ricompense, le ripete e scarta le altre.

La chiave del successo di Dreamer è la sua capacità di costruire un modello del mondo circostante e utilizzarlo per “immaginare” scenari futuri e guidare in questo modo il suo processo decisionale. Questo modello funziona in modo simile ai nostri pensieri astratti: non è una replica esatta dell’ambiente, ma permette all’agente di prevedere le potenziali ricompense di diverse azioni usando meno risorse computazionali di quante ne sarebbero necessarie per completare quelle azioni in Minecraft. “Il modello del mondo equipaggia davvero il sistema di IA con la capacità di immaginare il futuro”, afferma Hafner. Questa capacità potrebbe anche aiutare a creare robot in grado di imparare a interagire nel mondo reale, dove i costi del metodo “prova e sbaglia” sono molto più alti che in un videogioco.