人工智能效率竞赛迎来了一位新选手。Etched 发布了 Sohu,这是一款从头开始设计的 ASIC 芯片,专门用于执行 Llama 或 GPT 等 Transformer 模型。忘掉通用 GPU 吧;这款专用集成电路承诺以远超任何传统硬件的速度加速推理。
固定架构 vs 灵活性:必要的牺牲 🎯
与可以处理任何图形或计算负载的 GPU 不同,Sohu 是一个功能单一的芯片。其电路针对 Transformer 的关键操作进行了极致优化:注意力机制、投影和前馈层。通过消除通用可编程性的开销,它实现了更高的每瓦性能。缺点显而易见:如果明天出现一种不同的人工智能架构,这款芯片将过时。
拥有一辆只能直线行驶的法拉利的戏剧性 🏎️
想象一下,你买了一辆速度极快的赛车,但它只能在一条笔直的收费高速公路上行驶。这就是 Sohu。而 GPU 就像一辆能装载一切的货车,这款 ASIC 则是一辆在第一个环岛就会卡住的 F1 赛车。如果你是一家依赖 Llama 生存的公司,它就是你的王牌。对于其他人来说,只能等待市场来决定专业化是否值得买单。