1. 首页>>分享

英伟达GTC大会发布Blackwell Ultra GPU及NVL72服务器,预告Rubin GPU及服务器系列

在 3 月 18 日当地时间召开的 GTC 大会上,英伟达的 CEO 黄仁勋进行了发布动作。他发布了全新的 Blackwell Ultra GPU,并且还发布了基于该芯片的 NVL72 服务器。与此同时,他预告了下一代的 Rubin GPU 以及 Rubin NVL144 和 Rubin Ultra NVL576 服务器。这些产都将成为英伟达接下来开拓AI市场的新“利器”。

Blackwell Ultra 仍在缓慢推进:仅仅是 HBM3e 的容量提升到了 288GB。

英伟达去年在 GTC 发布了 Blackwell 架构,同时推出了 GB200 芯片。今年,其正式名称进行了微调,没有叫之前传言的 GB300,而是直接将其称为 Blackwell Ultra。

从硬件方面来看,是在去年的基础上更换了新的 HBM 内存。简单来说,Blackwell Ultra 就等于 Blackwell 的大显存版本。

Blackwell Ultra 由两颗台积电的 N4P 工艺的芯片构成,N4P 属于 5nm 家族的 4nm 加强版。这两颗芯片包含 Blackwell GPU 和 Grace CPU,并且还搭配了更大容量的 HBM 封装。具体来说,搭配了更先进的 12 层堆叠的 HBM3e,使得显存容量提升到了 288GB。它和上一代一样支持第五代 NVLink,能够实现 1.8TB/s 的片间互联带宽。

图片

NVLink历代性能参数

Blackwell GPU 的 FP4 精度算力因存储升级可达到 15PetaFLOPS。其基于 Attention Acceleration 机制的推理速度,相较于 Hopper 架构芯片提升了 2.5 倍。

图片

Blackwell Ultra NVL72官方图

2、Blackwell Ultra NVL72

英伟达今年推出了类似的产品 BlackWell Ultra NVL72 机柜,它和 GB200 NVL72 一样。该机柜由 18 个计算托盘构成,每个计算托盘包含 4 颗 BlackWell Ultra GPU 与 2 颗 Grace CPU,总计有 72 颗 BlackWell Ultra GPU 和 36 颗 Grace CPU。其 HBM 容量达到 20TB,总带宽为 576TB/s,还有 9 个 NVLink 交换机托盘,内含 18 颗 NVLink 交换机芯片,节点间 NVLink 带宽为 130TB/s。

机柜内置有 72 张 CX - 8 网卡,能提供 14.4TB/s 的带宽。Quantum - X800 InfiniBand 以及 Spectrum - X 800G 以太网卡,能够降低延迟和抖动,还对大规模 AI 集群提供支持。另外,机架整合了 18 张 BlueField - 3 DPU,用于增强多租户网络、安全性以及数据加速。

英伟达称这款产品是专门为 AI 推理时代而定制的。它在进行 FP4 精度的推理任务时,能够达到每秒百亿亿次浮点运算,即 1.1 ExaFLOPS;在进行 FP8 精度的训练任务时,性能为 1.2 ExaFLOPS。前一代产品是 GB200 NVL72,这一代产品的 AI 性能提升至 1.5 倍。HBM 容量提升到 1.5 倍。支持的 40TB 快速内存容量是前代的 1.5 倍。网卡总带宽是前代的 2 倍。与 Hopper 架构同定位的 DGX 机柜产品相比,可为数据中心提供 50 倍增收的机会。应用场景包含物理 AI,此物理 AI 用于机器人以及智驾训练用的数据仿真合成。

图片

Blackwell Ultra NVL72 的硬件参数以及 GB200 NVL72 的硬件参数

官方提供的信息表明,6710 亿参数的 DeepSeek-R1 进行推理时,若基于 H100 产品,能实现每秒 100 tokens;而采用 Blackwell Ultra NVL72 方案的话,则可以达到每秒 1000 tokens。

换算为时间的话,对于同样的推理任务,H100跑完需要 1.5 分钟,而 Blackwell Ultra NVL72 跑完只需 15 秒。

英伟达提供的信息表明,Blackwell NVL72 相关产品预计在 2025 年下半年开始上市。其客户涵盖服务器厂商、云厂以及算力租赁服务商等几大类别。

图片

英伟达的路线图显示,GTC2025 的主场是 Blackwell Ultra。

3、Vera Rubin NVL144

黄仁勋在此次 GTC 大会预告了下一代 GPU,它将于 2026 年上市,基于 Rubin 架构,还有基于该 GPU 的 Vera Rubin NVL144

Vera Rubin NVL144 集成了 72 颗 Vera CPU 和 144 颗 Rubin GPU。它采用了 288GB 显存的 HBM4 芯片,显存带宽达到 13TB/s。并且搭配了第六代 NVLink 和 CX9 网卡。

图片

英伟达官方提供的Rubin NVL144参数

这个产品的性能很强。它的 FP4 精度的推理算力达到了 3.6ExaFLOPS,FP8 精度的训练算力也达到了 1.2ExaFlOPS,并且其性能是 Blackwell Ultra NVL72 的 3.3 倍。配备了带宽为 13TB/s 的 HBM4;具有 75TB 的快速内存,其容量是前代的 1.6 倍;支持带宽为 260TB/s 的 NVLink 6,是前代的 2 倍;支持总带宽为 28.8TB/s 的 CX9 网卡,是前代的 2 倍。

5、Rubin Ultra NVL576

如果你觉得还不够,这是没关系的。在 2027 年,会有更强的 Rubin Ultra NVL576 机柜。其 FP4 精度的推理算力是 15ExaFLOPS,FP8 精度的训练算力是 5ExaFLOPS,这分别比 Blackwell Ultra NVL72 高出 14 倍。

图片

图片

英伟达官方提供的Rubin Ultra NVL576参数

Rubin Ultra 的 Veras 系统在硬件配置方面,延续了有着 88 个定制 Arm 核心的设计。这些核心每个都能支持 176 个线程。并且通过 NVLink-C2C 提供了 1.8 TB/s 的带宽。

GPU 方面,Rubin Ultra 集成了 4 个 GPU,这些 GPU 的大小如同 Reticle 一般。每一颗这样的 GPU 都能提供 100 petaflops 的 FP4 计算能力。同时,它还配备了 1TB 的 HBM4e 内存。在性能以及内存容量上,都达到了全新的高度。

在这次 GTC 大会当中,黄仁勋正式把下一代 AI GPU 芯片的命名给揭晓了。这个命名是物理学家费曼(Feynman)。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275084.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息