AI効率化競争に新たな挑戦者が現れた。Etchedは、LlamaやGPTのようなTransformerモデルを排他的に実行するためにゼロから設計されたASICチップ、Sohuを発表した。汎用GPUは忘れてください。この特定用途向け集積回路は、従来のハードウェアを凌駕する速度で推論を加速することを約束します。
固定アーキテクチャ vs 柔軟性:必要な犠牲 🎯
あらゆるグラフィックや計算負荷を処理するGPUとは異なり、Sohuは機能的なモノリスです。その回路は、Transformerの主要な操作(アテンション、投影、フィードフォワード層)のために極限まで最適化されています。汎用プログラマビリティのオーバーヘッドを排除することで、ワットあたりの性能が大幅に向上します。欠点は明らかです。明日、異なるAIアーキテクチャが登場すれば、このチップは時代遅れになります。
直線しか走れないフェラーリを所有するドラマ 🏎️
非常に速いが、有料の直線高速道路でしか機能しないレーシングカーを買うことを想像してみてください。それがSohuです。GPUがあらゆるものを運べるバンであるのに対し、このASICは最初のロータリーで立ち往生するF1マシンです。Llamaに依存して生きている企業にとっては、それは切り札です。それ以外の人にとっては、専門化が利益を生むかどうかを市場が決定するのを待つしかありません。