메타가 2세대 추론 가속기인 MTIA v2(코드명 아르테미스)를 공개했습니다. 이 칩은 게임이나 텍스트 생성형 AI가 아닌, 페이스북과 인스타그램의 추천 알고리즘을 더 빠르고 효율적으로 작동하게 하는 매우 구체적인 작업을 위해 설계되었습니다.
추천 엔진을 위한 특화 칩 🚀
MTIA v2는 메타의 순위 및 추천 시스템에서 사용하는 것과 같은 저정밀 딥러닝 모델에 초점을 맞춘 추론 가속기입니다. 256개의 코어와 128MB의 SRAM 메모리를 갖춘 아르테미스는 최대 102.4 TOPS(INT8)의 성능을 제공합니다. TSMC의 5nm 공정으로 설계되어 90W의 전력을 소비하며, 서버를 위한 속도와 발열 간의 균형을 최적화합니다. 핵심은 임베딩 및 제품 검색 작업의 지연 시간을 줄이는 데이터 아키텍처에 있습니다.
아르테미스: 당신의 릴스 피드는 저절로 추천되지 않으니까 🔥
요컨대, 메타는 알고리즘이 피아노를 치는 고양이 영상이 당신의 피드에서 이모의 레시피보다 먼저 나와야 하는지 결정하도록 특별히 제작된 프로세서를 만든 것입니다. 이제 일반 서버가 계산할 때까지 기다리는 대신, 아르테미스는 순식간에 처리하고 전력도 덜 소모합니다. 이 모든 것은 당신이 보고 싶다고 전혀 몰랐던 것들을 스크롤하며 계속 붙잡혀 있게 하기 위함입니다. 에너지 효율은 핑계일 뿐이며, 진짜 목표는 당신이 휴대폰을 놓지 못하게 하는 것입니다.