IA passa Pokémon Fire Red vendo telas, mas alucina no básico

A Anthropic conseguiu que sua inteligência artificial completasse Pokémon Fire Red sem ajuda externa, apenas analisando capturas de tela. O sistema aprendeu por tentativa e erro, como um jogador humano, mas sem fadiga. No entanto, o fio se rompe quando você pergunta algo sobre política ou saúde: ele responde com fantasias.

$tela vintage de Game Boy Advance mostrando cena de batalha Pokémon, Charizard usando ataque Lança-Chamas, fluxos de dados digitais visíveis nas bordas da tela, nós de rede neural de IA brilhando fracamente ao redor do dispositivo, efeito de tela dividida com o lado direito mostrando manchetes de notícias políticas alucinadas se dissolvendo em estática, artefatos de glitch corrompendo a parte inferior da tela, configuração mãos-livres com braço de câmera gravando a tela, teclado e monitor ao fundo exibindo código Python e logs de terminal, ilustração técnica cinematográfica, iluminação neon azul e vermelha, visualização foto-realista de engenharia, desfoque de movimento na animação de ataque, partículas de erro brilhantes se espalhando da área corrompida, texturas de hardware ultra-detalhadas$

Aprendizado por reforço visual sem intervenção humana 🎮

O modelo da Anthropic processa cada frame do jogo como uma imagem estática, tomando decisões de movimento e combate baseadas em recompensas. Ele não acessa a memória RAM nem dados internos do cartucho. Usa redes neurais convolucionais para identificar sprites e texto, e um algoritmo de reforço que otimiza a rota. O treinamento exigiu milhares de partidas simuladas, mas o resultado é um agente capaz de vencer a Elite Four sem conhecer as regras do jogo.

Passa o jogo, mas não sabe o que é um partido político 🤖

A mesma IA que derrota Mewtwo com um Charmander evoluído fica em branco se você pedir para explicar o sistema de saúde. É como um amigo que resolve um cubo mágico em dez segundos, mas acredita que a Finlândia fica na África. Muito habilidosa com os pixels, mas zero senso comum. Pelo menos não reclama dos tempos de carregamento nem pede para salvar o jogo a cada cinco minutos.