A corrida pela eficiência em IA tem um novo concorrente. A Etched apresentou o Sohu, um chip ASIC projetado do zero para executar exclusivamente modelos Transformer como Llama ou GPT. Esqueça as GPUs de propósito geral; este circuito integrado aplicado promete acelerar as inferências a velocidades que deixam qualquer hardware convencional para trás.
Arquitetura fixa contra flexibilidade: o sacrifício necessário 🎯
Ao contrário das GPUs, que lidam com qualquer carga gráfica ou de computação, o Sohu é um monolito funcional. Sua circuitaria é otimizada ao milímetro para as operações-chave dos Transformers: atenção, projeções e camadas feed-forward. Ao eliminar a sobrecarga da programabilidade geral, alcança um desempenho por watt muito superior. A desvantagem é óbvia: se amanhã surgir uma arquitetura de IA diferente, o chip ficará obsoleto.
O drama de ter uma Ferrari que só sabe andar em linha reta 🏎️
Imagine comprar um carro de corrida que é super rápido, mas só funciona em uma autoestrada reta com pedágio. Esse é o Sohu. Enquanto as GPUs são como uma van que carrega de tudo, este ASIC é um F1 que trava na primeira rotatória. Se você é uma empresa que vive e morre pelo Llama, é seu trunfo na manga. Para o resto, será preciso esperar que o mercado decida se a especialização compensa a conta.