La carrera por la eficiencia en IA tiene un nuevo contendiente. Etched ha presentado el Sohu, un chip ASIC diseñado desde cero para ejecutar exclusivamente modelos Transformer como Llama o GPT. Olvida las GPUs de propósito general; este circuito integrado aplicado promete acelerar las inferencias a velocidades que dejan atrás a cualquier hardware convencional.
Arquitectura fija contra flexibilidad: el sacrificio necesario 🎯
A diferencia de las GPUs, que manejan cualquier carga gráfica o de cómputo, el Sohu es un monolito funcional. Su circuitería está optimizada al milímetro para las operaciones clave de los Transformers: atención, proyecciones y capas feed-forward. Al eliminar la sobrecarga de la programabilidad general, logra un rendimiento por vatio muy superior. La desventaja es obvia: si mañana surge una arquitectura de IA diferente, el chip quedará obsoleto.
El drama de tener un Ferrari que solo sabe ir en línea recta 🏎️
Imagina comprar un coche de carreras que es rapidísimo, pero solo funciona en una autopista recta de peaje. Eso es el Sohu. Mientras las GPUs son como una furgoneta que lleva de todo, este ASIC es un F1 que se bloquea en la primera rotonda. Si eres una empresa que vive y muere por Llama, es tu as bajo la manga. Para el resto, tocará esperar a que el mercado decida si la especialización paga la factura.