Das Rennen um die Effizienz in der KI hat einen neuen Anwärter. Etched hat den Sohu vorgestellt, einen ASIC-Chip, der von Grund auf dafür entwickelt wurde, ausschließlich Transformer-Modelle wie Llama oder GPT auszuführen. Vergiss die Allzweck-GPUs; dieser anwendungsspezifische integrierte Schaltkreis verspricht, Inferenzen mit Geschwindigkeiten zu beschleunigen, die jede herkömmliche Hardware hinter sich lassen.
Feste Architektur gegen Flexibilität: das notwendige Opfer 🎯
Im Gegensatz zu GPUs, die jede Grafik- oder Rechenlast bewältigen, ist der Sohu ein funktionaler Monolith. Seine Schaltkreise sind auf die Schlüsseloperationen der Transformer optimiert: Aufmerksamkeit, Projektionen und Feed-Forward-Schichten. Durch die Eliminierung des Overheads der allgemeinen Programmierbarkeit erreicht er eine weitaus höhere Leistung pro Watt. Der Nachteil ist offensichtlich: Sollte morgen eine andere KI-Architektur aufkommen, wird der Chip veraltet sein.
Das Drama, einen Ferrari zu besitzen, der nur geradeaus fahren kann 🏎️
Stell dir vor, du kaufst ein Rennauto, das blitzschnell ist, aber nur auf einer geraden Mautautobahn funktioniert. Das ist der Sohu. Während GPUs wie ein Lieferwagen sind, der alles transportieren kann, ist dieser ASIC ein Formel-1-Wagen, der sich am ersten Kreisel festfährt. Wenn du ein Unternehmen bist, das für Llama lebt und stirbt, ist er dein Trumpf im Ärmel. Für den Rest heißt es abwarten, ob der Markt entscheidet, dass sich die Spezialisierung rechnet.