La course à l'efficacité en IA a un nouveau concurrent. Etched a présenté le Sohu, une puce ASIC conçue de zéro pour exécuter exclusivement des modèles Transformer comme Llama ou GPT. Oubliez les GPU à usage général ; ce circuit intégré dédié promet d'accélérer les inférences à des vitesses qui laissent derrière tout matériel conventionnel.
Architecture fixe contre flexibilité : le sacrifice nécessaire 🎯
Contrairement aux GPU, qui gèrent n'importe quelle charge graphique ou de calcul, le Sohu est un monolithe fonctionnel. Sa circuiterie est optimisée au millimètre pour les opérations clés des Transformers : attention, projections et couches feed-forward. En éliminant la surcharge de la programmabilité générale, il atteint un rendement par watt très supérieur. L'inconvénient est évident : si demain une architecture d'IA différente émerge, la puce deviendra obsolète.
Le drame d'avoir une Ferrari qui ne sait aller qu'en ligne droite 🏎️
Imaginez acheter une voiture de course très rapide, mais qui ne fonctionne que sur une autoroute droite à péage. C'est le Sohu. Alors que les GPU sont comme un fourgon qui transporte de tout, cet ASIC est une F1 qui se bloque au premier rond-point. Si vous êtes une entreprise qui vit et meurt pour Llama, c'est votre atout maître. Pour les autres, il faudra attendre que le marché décide si la spécialisation paie la facture.