A Meta apresentou a segunda geração de seu acelerador de inferência, o MTIA v2, cujo codinome é Artemis. Este chip não foi projetado para jogos nem para IA generativa de texto, mas para uma tarefa muito específica: fazer com que os algoritmos de recomendação do Facebook e Instagram funcionem mais rápido e com maior eficiência energética.
Um chip específico para o motor de recomendações 🚀
O MTIA v2 é um acelerador de inferência focado em modelos de Deep Learning de baixa precisão, como os usados pelos sistemas de classificação e recomendação da Meta. Com 256 núcleos e uma memória SRAM de 128 MB, o Artemis oferece um desempenho de até 102,4 TOPS (INT8). Seu design em 5nm da TSMC permite um consumo de 90W, otimizando o equilíbrio entre velocidade e calor para servidores. A chave está em sua arquitetura de dados, que reduz a latência em tarefas de embeddings e busca de produtos.
Artemis: porque seu feed de Reels não vai se recomendar sozinho 🔥
Vamos lá, a Meta fabricou um processador específico para que o algoritmo decida se aquele vídeo de um gato tocando piano merece estar no seu feed antes da receita da sua tia. Agora, em vez de esperar que um servidor genérico calcule isso, o Artemis faz em um piscar de olhos e gastando menos luz. Tudo para que você fique grudado na rolagem vendo coisas que nem sabia que queria ver. A eficiência energética é uma desculpa; o objetivo real é que você não consiga largar o celular.