
Cerebras Systems 推出 WSE-3,世界上最大的处理器
公司 Cerebras Systems 正式发布了 WSE-3(Wafer Scale Engine 3),这是其革命性晶圆级处理器概念的第三代迭代。这个硅巨兽保持了其作为现有最大芯片的记录,在单个 300 毫米晶圆上制造。其设计集成了前所未有的 4 万亿个晶体管 和 900,000 个计算核心,所有这些都专门针对加载和执行人工智能模型进行了优化。这种怪物般的架构允许将极其复杂的语言模型视为单一实体,从而彻底简化工作流程,避免需要在数千个独立的 GPU 之间分配任务。🚀
性能和效率的量子飞跃
与前代 WSE-2 直接相比,新芯片在保持相同能耗和不变物理尺寸的情况下,实现了计算性能翻倍。这一进步得益于更先进的制造工艺和显著改进的内存架构。该系统旨在消除通常会减缓大规模 AI 模型训练的瓶颈,将海量计算能力集中在单个物理设备中。其方法从根本上解决了高性能 AI 计算中的最大障碍之一:连接和协调数千个较小芯片的复杂性。💡
WSE-3 的关键特性:- 单晶圆制造:在单个 300 mm 硅晶圆上生产,不切割。
- 晶体管密度:容纳 4 万亿个晶体管,实现极高密度计算。
- 专用核心:配备 900,000 个专为优化 AI 工作负载而设计的核。
这是一件重新定义半导体行业“大”含义的工程杰作。
统一一切的架构
WSE-3 的主要优势在于其 统一架构。它具有统一内存空间 和直接集成在芯片中的高速互连网络。这使得其数十万个核心能够以极高效率相互通信,而不会遭受管理传统 GPU 集群固有的软件延迟和开销。对于开发者来说,这意味着可以为单个硬件实例进行编程,而不是组织和协调数千个独立处理器的工作,从而大幅加速模型开发和部署时间。⚙️
统一架构的好处:- 简化编程:开发者与单个系统交互,而不是分布式集群。
- 降低延迟:核心间通信超快,因为它们都在同一芯片上。
- 消除软件开销:无需复杂软件来管理设备间并行化。
重新定义工程极限
WSE-3 不仅仅是一个芯片;它是一个完整的系统,需要定制工程解决方案,如专用液体冷却系统。此外,它在硬件级别引入了冗余,这意味着晶圆上的制造缺陷不会使整个设备失效,因为受影响的部分可以被隔离。这种方法不仅代表了技术上的 monumental 成就,还为构建硬件以应对当前人工智能最苛刻挑战树立了新范式,在传统架构主导的市场中确立了其作为彻底不同解决方案的地位。🏆