Meta MTIA v2 Artemis: a besta da Meta para te recomendar mais vídeos

A Meta apresentou a segunda geração de seu acelerador de inferência, o MTIA v2, cujo codinome é Artemis. Este chip não foi projetado para jogos nem para IA generativa de texto, mas para uma tarefa muito específica: fazer com que os algoritmos de recomendação do Facebook e Instagram funcionem mais rápido e com maior eficiência energética.

Chip Meta MTIA v2 Artemis brilhando dentro de um rack de servidor, fluxos de dados de algoritmos de recomendação de redes sociais entrando no chip, dissipadores de calor dissipando energia de forma eficiente enquanto miniaturas de vídeos e métricas de engajamento pulsiam ao redor do processador, visualização cinematográfica de engenharia, texturas metálicas fotorrealistas, traços de circuito azuis e laranja acendendo durante o processamento de inferência, desfoque de movimento em pacotes de dados, fundo industrial de sala de servidores com ventiladores de resfriamento, arquitetura de silício ultradetalhada visível, iluminação dramática de ângulo baixo destacando a superfície do chip

Um chip específico para o motor de recomendações 🚀

O MTIA v2 é um acelerador de inferência focado em modelos de Deep Learning de baixa precisão, como os usados pelos sistemas de classificação e recomendação da Meta. Com 256 núcleos e uma memória SRAM de 128 MB, o Artemis oferece um desempenho de até 102,4 TOPS (INT8). Seu design em 5nm da TSMC permite um consumo de 90W, otimizando o equilíbrio entre velocidade e calor para servidores. A chave está em sua arquitetura de dados, que reduz a latência em tarefas de embeddings e busca de produtos.

Artemis: porque seu feed de Reels não vai se recomendar sozinho 🔥

Vamos lá, a Meta fabricou um processador específico para que o algoritmo decida se aquele vídeo de um gato tocando piano merece estar no seu feed antes da receita da sua tia. Agora, em vez de esperar que um servidor genérico calcule isso, o Artemis faz em um piscar de olhos e gastando menos luz. Tudo para que você fique grudado na rolagem vendo coisas que nem sabia que queria ver. A eficiência energética é uma desculpa; o objetivo real é que você não consiga largar o celular.