Etched Sohu: o ASIC que nasceu só para executar Transformers

18 de May de 2026 Publicado | Traducido del español

A corrida pela eficiência em IA tem um novo concorrente. A Etched apresentou o Sohu, um chip ASIC projetado do zero para executar exclusivamente modelos Transformer como Llama ou GPT. Esqueça as GPUs de propósito geral; este circuito integrado aplicado promete acelerar as inferências a velocidades que deixam qualquer hardware convencional para trás.

Chip ASIC Etched Sohu brilhando enquanto processa fluxos de dados do modelo Transformer, wafer de silício gravado com caminhos de rede neural, gráfico de comparação de GPU desaparecendo ao fundo, inferência de alta velocidade visualizada como pulsos de luz se movendo através de trilhas de circuito, ilustração técnica de engenharia, foto realista de chip die, arquitetura interna exposta com interconexões metálicas em camadas, fluxo de elétrons azul frio e laranja, perspectiva de lente macro, iluminação dramática de estúdio, texturas de semicondutores ultra-detalhadas

Arquitetura fixa contra flexibilidade: o sacrifício necessário 🎯

Ao contrário das GPUs, que lidam com qualquer carga gráfica ou de computação, o Sohu é um monolito funcional. Sua circuitaria é otimizada ao milímetro para as operações-chave dos Transformers: atenção, projeções e camadas feed-forward. Ao eliminar a sobrecarga da programabilidade geral, alcança um desempenho por watt muito superior. A desvantagem é óbvia: se amanhã surgir uma arquitetura de IA diferente, o chip ficará obsoleto.

O drama de ter uma Ferrari que só sabe andar em linha reta 🏎️

Imagine comprar um carro de corrida que é super rápido, mas só funciona em uma autoestrada reta com pedágio. Esse é o Sohu. Enquanto as GPUs são como uma van que carrega de tudo, este ASIC é um F1 que trava na primeira rotatória. Se você é uma empresa que vive e morre pelo Llama, é seu trunfo na manga. Para o resto, será preciso esperar que o mercado decida se a especialização compensa a conta.