La corsa all'efficienza nell'IA ha un nuovo contendente. Etched ha presentato Sohu, un chip ASIC progettato da zero per eseguire esclusivamente modelli Transformer come Llama o GPT. Dimentica le GPU generiche; questo circuito integrato applicato promette di accelerare le inferenze a velocità che lasciano indietro qualsiasi hardware convenzionale.
Architettura fissa contro flessibilità: il sacrificio necessario 🎯
A differenza delle GPU, che gestiscono qualsiasi carico grafico o di calcolo, Sohu è un monolito funzionale. La sua circuiteria è ottimizzata al millimetro per le operazioni chiave dei Transformer: attenzione, proiezioni e strati feed-forward. Eliminando il sovraccarico della programmabilità generale, raggiunge prestazioni per watt molto superiori. Lo svantaggio è ovvio: se domani emergesse un'architettura IA diversa, il chip diventerebbe obsoleto.
Il dramma di avere una Ferrari che sa solo andare dritta 🏎️
Immagina di comprare un'auto da corsa velocissima, ma che funziona solo su un'autostrada a pedaggio dritta. Questo è Sohu. Mentre le GPU sono come un furgone che trasporta di tutto, questo ASIC è una F1 che si blocca alla prima rotonda. Se sei un'azienda che vive e muore per Llama, è il tuo asso nella manica. Per gli altri, bisognerà aspettare che il mercato decida se la specializzazione paga il conto.