
Nvidia 公布 Vera Rubin 架构,用于融合处理和连接
Nvidia 已公布其下一代架构,名为 Vera Rubin,该架构标志着范式转变,通过原生方式将用于图形处理的单元与先进的网络功能相结合。此设计旨在使现代数据中心能够更高效地处理和传输信息,解决当前最大的挑战之一。🚀
网络获得处理智能
Vera Rubin 的一个核心概念是其在网络基础设施中直接执行计算操作的能力。这意味着节点不仅限于发送数据包,还可以在传输过程中操纵和转换它们。这种被称为in-network computing的方法旨在大幅降低分布式复杂操作(如大型语言模型所需)的延迟和能耗。
网络计算的关键特性:- 降低延迟:在传输路径上处理数据,避免不必要的内存中央或其他处理器往返。
- 减少能耗:移动大量数据消耗大量能量;在网络中本地处理可节省功率。
- 加速分布式任务:如聚合结果或过滤信息等操作可在网络交换机上更快完成。
未来不仅仅在于拥有更快的处理器,而是让连电缆都开始思考来为我们节省时间。
芯片设计中的持续演进
Vera Rubin 代表 Nvidia 演进路线中的下一个逻辑步骤,包括之前的架构如 Blackwell 和 Hopper。通过更紧密地融合处理和连接功能,公司直接响应了人工智能模型在规模和复杂性上的增长需求。最终目标是更高效地扩展系统,克服当前数千处理器与内存库之间通信的瓶颈。
这种深度集成的优势:- 克服通信限制:缓解 GPU 与内存之间的带宽问题。
- 高效扩展:允许构建更大、更连贯的计算集群。
- 加速大规模模拟