AI 효율성 경쟁에 새로운 도전자가 등장했습니다. Etched가 Llama나 GPT와 같은 Transformer 모델만을 실행하도록 처음부터 설계된 ASIC 칩인 Sohu를 공개했습니다. 범용 GPU는 잊으세요; 이 주문형 집적 회로는 기존 하드웨어를 능가하는 속도로 추론을 가속화할 것을 약속합니다.
고정 아키텍처 대 유연성: 필요한 희생 🎯
모든 그래픽 또는 컴퓨팅 작업을 처리하는 GPU와 달리, Sohu는 기능적 모놀리스입니다. 그 회로는 Transformer의 핵심 작업인 어텐션, 프로젝션, 피드포워드 레이어에 맞춰 정밀하게 최적화되었습니다. 일반적인 프로그래밍 가능성의 오버헤드를 제거함으로써, 와트당 훨씬 뛰어난 성능을 달성합니다. 단점은 명확합니다. 만약 내일 다른 AI 아키텍처가 등장한다면, 이 칩은 쓸모없게 될 것입니다.
직선 도로만 달릴 줄 아는 페라리를 소유한 드라마 🏎️
매우 빠르지만 유료 직선 고속도로에서만 작동하는 경주용 자동차를 산다고 상상해보세요. 그것이 바로 Sohu입니다. GPU가 모든 것을 실어 나를 수 있는 밴이라면, 이 ASIC은 첫 번째 로터리에서 막히는 F1 자동차입니다. Llama에 사활을 걸고 있는 기업이라면, 이는 비장의 무기입니다. 나머지에게는, 시장이 전문화가 비용을 정당화하는지 결정할 때까지 기다려야 할 것입니다.