인공지능이 포켓몬 파이어레드를 화면 보며 플레이하지만 기본에서 환각을 보다

Anthropic은 인공지능이 외부 도움 없이 스크린샷만 분석하여 포켓몬 파이어레드를 클리어하는 데 성공했습니다. 이 시스템은 인간 플레이어처럼 시행착오를 통해 학습했지만 피로감은 없습니다. 하지만 정치나 건강에 대해 물어보면 실마리가 끊깁니다. 환상에 가득 찬 답변을 내놓기 때문입니다.

빈티지 Game Boy Advance 화면에 포켓몬 배틀 장면, 리자몽이 불꽃세례를 사용 중, 화면 가장자리를 따라 보이는 디지털 데이터 스트림, 기기 주변에 희미하게 빛나는 AI 신경망 노드, 분할 화면 효과로 오른쪽에는 환각된 정치 뉴스 헤드라인이 정지 화면으로 흐려짐, 화면 하단을 손상시키는 글리치 아티팩트, 화면을 녹화하는 카메라 암이 있는 핸즈프리 설정, 배경에 Python 코드와 터미널 로그를 표시하는 키보드와 모니터, 시네마틱 테크니컬 일러스트레이션, 네온 블루와 레드 조명, 포토리얼리스틱 엔지니어링 시각화, 공격 애니메이션의 모션 블러, 손상된 영역에서 퍼져 나가는 빛나는 오류 입자, 초고화질 하드웨어 텍스처

인간 개입 없는 시각적 강화 학습 🎮

Anthropic의 모델은 게임의 각 프레임을 정적 이미지로 처리하며, 보상에 기반하여 이동 및 전투 결정을 내립니다. RAM이나 카트리지 내부 데이터에는 접근하지 않습니다. 합성곱 신경망을 사용하여 스프라이트와 텍스트를 식별하고, 경로를 최적화하는 강화 알고리즘을 사용합니다. 훈련에는 수천 번의 시뮬레이션 게임이 필요했지만, 결과적으로 게임 규칙을 알지 못해도 사천왕을 이길 수 있는 에이전트가 탄생했습니다.

게임은 클리어하지만, 정당이 무엇인지는 모릅니다 🤖

레벨업한 파이리로 뮤츠를 쓰러뜨리는 바로 그 AI가 의료 시스템을 설명해 달라고 하면 멍해집니다. 10초 만에 루빅스 큐브를 맞추지만 핀란드가 아프리카에 있다고 믿는 친구와 같습니다. 픽셀 처리에는 매우 능숙하지만 상식은 전무합니다. 적어도 로딩 시간에 불평하거나 5분마다 게임 저장을 요구하지는 않는다는 점이 위안입니다.