Adrian de Wynter, scienziato e ricercatore Microsoft presso l’Università di York in Inghilterra, ha deciso di verificare se il modello linguistico GPT-4 alla base di ChatGPT potesse giocare a Doom senza formazione. Si è scoperto che poteva, ma non bene.
L’intelligenza artificiale generalmente eseguiva le azioni di gioco necessarie. Cioè, si è mosso per i livelli, ha aperto le porte e ha sparato con le armi.
Tuttavia, ha avuto problemi con i movimenti, a volte rimaneva bloccato negli angoli, ma la cosa peggiore è che l’IA si dimenticava degli avversari non appena scomparivano dal suo campo visivo. Questo nonostante le istruzioni ti dicano cosa fare se non c’è nessun nemico sullo schermo. Tuttavia, considerando che l’IA non è stata affatto addestrata nei giochi, questo è già molto buono.
Separatamente, l’autore del progetto nota che è riuscito facilmente a far giocare GPT-4. Sì, solo nel mondo virtuale, ma in effetti non è poi così tanto differente da un mondo reale.
Separatamente, vale la pena notare che è impossibile prendere e lasciare che GPT-4 giochi a qualsiasi gioco. In questo caso particolare, de Winter ha sviluppato un componente Vision chiamato GPT-4V, che prende screenshot dal motore di gioco e restituisce le descrizioni della struttura dello stato del gioco.
Ha poi combinato questo con un agent che chiama GPT-4 per prendere decisioni basate su testo e cronologia. L’agent viene incaricato di tradurre le sue risposte in comandi da tastiera che hanno significato per il motore di gioco. Le interazioni sono state gestite tramite un livello di gestione costituito da un collegamento Python open source al motore Doom C in esecuzione su Matplotlib.