IA проходит Pokémon Rojo Fuego глядя на экраны, но галлюцинирует в основах

Anthropic добилась того, что её искусственный интеллект прошёл Pokémon FireRed без внешней помощи, лишь анализируя скриншоты. Система училась методом проб и ошибок, как человек-игрок, но без усталости. Однако всё рушится, когда вы задаёте ей вопрос о политике или здравоохранении: она отвечает фантазиями.

винтажный экран Game Boy Advance с изображением битвы покемонов, Чаризард использует атаку Огнемёт, по краям экрана видны цифровые потоки данных, вокруг устройства слабо мерцают узлы нейросети ИИ, эффект разделённого экрана: правая сторона показывает галлюцинирующие заголовки политических новостей, растворяющиеся в статике, глитч-артефакты искажают нижнюю часть экрана, безручная установка с камерой, записывающей экран, на заднем плане клавиатура и монитор с кодом Python и логами терминала, кинематографичная техническая иллюстрация, неоновое синее и красное освещение, фотореалистичная инженерная визуализация, размытие движения анимации атаки, светящиеся частицы ошибок, распространяющиеся из искажённой области, сверхдетализированные текстуры оборудования

Визуальное обучение с подкреплением без вмешательства человека 🎮

Модель Anthropic обрабатывает каждый кадр игры как статичное изображение, принимая решения о движении и бою на основе вознаграждений. Она не получает доступ к оперативной памяти или внутренним данным картриджа. Используются свёрточные нейронные сети для идентификации спрайтов и текста, а также алгоритм подкрепления, оптимизирующий маршрут. Обучение потребовало тысяч симулированных партий, но результатом стал агент, способный победить Элитную четвёрку, не зная правил игры.

Проходит игру, но не знает, что такое политическая партия 🤖

Тот же ИИ, который побеждает Мьюту с прокачанным Чармандером, впадает в ступор, если попросить его объяснить систему здравоохранения. Это как друг, который собирает кубик Рубика за десять секунд, но считает, что Финляндия находится в Африке. Очень умелый с пикселями, но абсолютно лишённый здравого смысла. По крайней мере, он не жалуется на время загрузки и не просит сохранить игру каждые пять минут.