A Anthropic conseguiu que sua inteligência artificial completasse Pokémon Fire Red sem ajuda externa, apenas analisando capturas de tela. O sistema aprendeu por tentativa e erro, como um jogador humano, mas sem fadiga. No entanto, o fio se rompe quando você pergunta algo sobre política ou saúde: ele responde com fantasias.
Aprendizado por reforço visual sem intervenção humana 🎮
O modelo da Anthropic processa cada frame do jogo como uma imagem estática, tomando decisões de movimento e combate baseadas em recompensas. Ele não acessa a memória RAM nem dados internos do cartucho. Usa redes neurais convolucionais para identificar sprites e texto, e um algoritmo de reforço que otimiza a rota. O treinamento exigiu milhares de partidas simuladas, mas o resultado é um agente capaz de vencer a Elite Four sem conhecer as regras do jogo.
Passa o jogo, mas não sabe o que é um partido político 🤖
A mesma IA que derrota Mewtwo com um Charmander evoluído fica em branco se você pedir para explicar o sistema de saúde. É como um amigo que resolve um cubo mágico em dez segundos, mas acredita que a Finlândia fica na África. Muito habilidosa com os pixels, mas zero senso comum. Pelo menos não reclama dos tempos de carregamento nem pede para salvar o jogo a cada cinco minutos.