Anthropic è riuscita a far completare a la sua intelligenza artificiale Pokémon Rosso Fuoco senza aiuto esterno, solo analizzando screenshot. Il sistema ha imparato per tentativi ed errori, come un giocatore umano ma senza affaticamento. Tuttavia, il filo si spezza quando gli chiedi qualcosa di politica o salute: risponde con fantasie.
Apprendimento per rinforzo visivo senza intervento umano 🎮
Il modello di Anthropic elabora ogni frame del gioco come un'immagine statica, prendendo decisioni di movimento e combattimento basate su ricompense. Non accede alla RAM né ai dati interni della cartuccia. Utilizza reti neurali convoluzionali per identificare sprite e testo, e un algoritmo di rinforzo che ottimizza il percorso. L'addestramento ha richiesto migliaia di partite simulate, ma il risultato è un agente in grado di sconfiggere l'Elite Four senza conoscere le regole del gioco.
Supera il gioco, ma non sa cosa sia un partito politico 🤖
La stessa IA che sconfigge Mewtwo con un Charmander potenziato si blocca se le chiedi di spiegare il sistema sanitario. È come un amico che risolve un cubo di Rubik in dieci secondi ma crede che la Finlandia sia in Africa. Molto abile con i pixel, ma zero senso comune. Almeno non si lamenta dei tempi di caricamento né ti chiede di salvare la partita ogni cinque minuti.