Meta ha presentato la seconda generazione del suo acceleratore di inferenza, l'MTIA v2, nome in codice Artemis. Questo chip non è progettato per i giochi né per l'IA generativa testuale, ma per un compito molto specifico: far funzionare gli algoritmi di raccomandazione di Facebook e Instagram più velocemente e con maggiore efficienza energetica.
Un chip specifico per il motore di raccomandazione 🚀
L'MTIA v2 è un acceleratore di inferenza focalizzato su modelli di Deep Learning a bassa precisione, come quelli utilizzati dai sistemi di ranking e raccomandazione di Meta. Con 256 core e una memoria SRAM di 128 MB, Artemis offre prestazioni fino a 102,4 TOPS (INT8). Il suo design a 5nm di TSMC consente un consumo di 90W, ottimizzando l'equilibrio tra velocità e calore per i server. La chiave sta nella sua architettura dati, che riduce la latenza nelle attività di embedding e ricerca di prodotti.
Artemis: perché il tuo feed di Reels non si raccomanderà da solo 🔥
Insomma, Meta ha prodotto un processore specifico affinché l'algoritmo decida se quel video di un gatto che suona il pianoforte meriti di stare nel tuo feed prima della ricetta di tua zia. Ora, invece di aspettare che un server generico lo calcoli, Artemis lo fa in un batter d'occhio e consumando meno energia. Il tutto per tenerti incollato allo scroll a vedere cose che nemmeno sapevi di voler vedere. L'efficienza energetica è una scusa; l'obiettivo reale è che tu non riesca a posare il cellulare.