Meta hat die zweite Generation seines Inferenzbeschleunigers vorgestellt, den MTIA v2, dessen Codename Artemis lautet. Dieser Chip ist nicht für Spiele oder generative Text-KI konzipiert, sondern für eine sehr spezifische Aufgabe: die Empfehlungsalgorithmen von Facebook und Instagram schneller und energieeffizienter arbeiten zu lassen.
Ein spezieller Chip für die Empfehlungsmaschine 🚀
Der MTIA v2 ist ein Inferenzbeschleuniger, der sich auf Deep-Learning-Modelle mit niedriger Präzision konzentriert, wie sie in den Ranking- und Empfehlungssystemen von Meta verwendet werden. Mit 256 Kernen und 128 MB SRAM-Speicher bietet Artemis eine Leistung von bis zu 102,4 TOPS (INT8). Sein 5nm-Design von TSMC ermöglicht eine Leistungsaufnahme von 90W und optimiert so das Gleichgewicht zwischen Geschwindigkeit und Wärme für Server. Der Schlüssel liegt in seiner Datenarchitektur, die die Latenz bei Aufgaben wie Embeddings und Produktsuche reduziert.
Artemis: Denn dein Reels-Feed wird sich nicht von alleine empfehlen 🔥
Kurz gesagt, Meta hat einen speziellen Prozessor hergestellt, damit der Algorithmus entscheiden kann, ob dieses Video einer Katze, die Klavier spielt, es verdient, in deinem Feed zu erscheinen, bevor das Rezept deiner Tante kommt. Anstatt darauf zu warten, dass ein generischer Server es berechnet, erledigt Artemis dies im Handumdrehen und verbraucht dabei weniger Strom. Alles nur, damit du am Scrollen kleben bleibst und Dinge siehst, von denen du nicht einmal wusstest, dass du sie sehen wolltest. Die Energieeffizienz ist eine Ausrede; das eigentliche Ziel ist, dass du das Handy nicht loslassen kannst.