IA gioca a Pokémon Rosso Fuoco guardando gli schermi, ma allucina sulle basi

Anthropic è riuscita a far completare a la sua intelligenza artificiale Pokémon Rosso Fuoco senza aiuto esterno, solo analizzando screenshot. Il sistema ha imparato per tentativi ed errori, come un giocatore umano ma senza affaticamento. Tuttavia, il filo si spezza quando gli chiedi qualcosa di politica o salute: risponde con fantasie.

vintage Game Boy Advance screen showing Pokémon battle scene, Charizard using Flamethrower attack, digital data streams visible along screen edges, AI neural network nodes glowing faintly around the device, split screen effect with right side showing hallucinated political news headlines dissolving into static, glitch artifacts corrupting the bottom of the screen, hands-free setup with camera arm recording the screen, keyboard and monitor in background displaying Python code and terminal logs, cinematic technical illustration, neon blue and red lighting, photorealistic engineering visualization, motion blur on attack animation, glowing error particles spreading from the corrupted area, ultra-detailed hardware textures

Apprendimento per rinforzo visivo senza intervento umano 🎮

Il modello di Anthropic elabora ogni frame del gioco come un'immagine statica, prendendo decisioni di movimento e combattimento basate su ricompense. Non accede alla RAM né ai dati interni della cartuccia. Utilizza reti neurali convoluzionali per identificare sprite e testo, e un algoritmo di rinforzo che ottimizza il percorso. L'addestramento ha richiesto migliaia di partite simulate, ma il risultato è un agente in grado di sconfiggere l'Elite Four senza conoscere le regole del gioco.

Supera il gioco, ma non sa cosa sia un partito politico 🤖

La stessa IA che sconfigge Mewtwo con un Charmander potenziato si blocca se le chiedi di spiegare il sistema sanitario. È come un amico che risolve un cubo di Rubik in dieci secondi ma crede che la Finlandia sia in Africa. Molto abile con i pixel, ma zero senso comune. Almeno non si lamenta dei tempi di caricamento né ti chiede di salvare la partita ogni cinque minuti.