1. 首页>>分享

GTC2025大会揭秘:NVIDIA硅光CPO交换机技术引领AI基础设施变革

在 GTC2025 大会里,NVIDIA 继续讲着“算力的故事”。倘若 AI 的发展依旧依照 scaling law(规模定律),那么这个故事就能够持续讲下去。

事实是,“算力不眠”的核心框架没有改变。然而,底层技术架构正在悄悄地发生着变革。

行业目光聚焦在 Blackwell Ultra GPU 的性能突破上。演讲中有几分钟的技术发布,内容是“将硅光技术直接集成至交换机芯片”。这几分钟的技术发布实则暗藏着 AI 基础设施演进的关键密码。

英伟达的CPO究竟是什么?

在 GTC 大会上,英伟达在黄仁勋的 Keynote 环节宣布了 Spectrum-X 和 Quantum-X 硅光 CPO 交换机。

这两款产品支持 144×800G 的配置,该配置是 H2 2025 推出的;同时也支持 512×800G 的配置,此配置是 H2 2026 推出的。它们的目的是满足 AI 超算对高带宽、低功耗的迫切需求。

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_

Spectrum-X Photonics 是以太网交换机,它能够提供 512 个 800Gb/s 端口,也能够提供 2048 个 200Gb/s 端口,其总吞吐量可以达到 400Tbps。

Quantum-X Photonics 的 InfiniBand 交换机,具备 144 个端口,这些端口基于 200Gb/s SerDes,每个端口的速率为 800Gb/s,总吞吐能力达到 115.2Tbps。

这些交换机根据 Keynote 所提供的信息,与传统解决方案相比,具有显著的优势。

减少了系统整体的激光器数量(75%)

实现了3.5倍的能耗降低

网络弹性提升10倍,显著增强可靠性并保障运行时间

部署速度提升1.3倍

信号完整性提高到63倍

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

为百万GPUAI工厂打开大门

在发布会上,老黄曾说:“NVIDIA 把硅光直接整合到了交换机里。这样做打破了超大规模以及企业网络以往所存在的限制,为拥有百万 GPU 的 AI 工厂开启了大门。”

在 Scaling Law 的引导下,业界普遍认为应不断提升算力的规模。从系统层面来看,扩大算力规模存在两个方面:一方面是提升芯片的算力;另一方面是增加系统中芯片的数量,也就是提升集群的规模。而这又可以通过两种方式来实现:一种是横向扩展(Scale-Out);另一种是纵向扩展(Scale-Up)。

在第一种情形下,单芯片算力自身的效能提升主要受两个因素的作用。其一为算力值(密度),其二为内存带宽。若要实现大幅度的提升,都必须在高端工艺制程方面下功夫。

举例而言,在相同面积的情况下,3nm 制程的芯片其算力密度比 12nm 的要高许多。HBM 的带宽比传统的 DDR 要高很多。这些情况都与生产制造能力有着很强的关联。

对于 Fabless 的 AI 芯片公司而言,卷算力就意味着卷制程,已经不能仅仅依靠自身架构设计的巧妙来达成了,而是要看是否能够获得甚至牵头开展顶级制造能力的竞争。即便这些问题都能够得到解决,基于电子计算的硅芯片的高端制程工艺的提升,也遭遇到了物理极限的限制(划重点,后面会提及)。

第二种是集群规模的提升。横向扩展指的是突破规模限制进行扩展。纵向扩展指的是成比例地增加性能。

横向扩展意味着分布式计算。它通过增添独立的服务器,以此来分散工作负载,进而提升计算容量。在 AI 集群中,这类似于 InfiniBand 或者 RoCE 网络所进行的工作。

专注于对单台服务器或基于机箱的系统进行升级,通过向现有的系统添加芯片来提高算力。在 AI 集群中,其类似于 NVLink 所进行的操作。

可以看出,提升集群规模算力的本质,是在卷通信技术;

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

CPO究竟解决了什么问题?

集群中的组网技术成了系统算力提升的关键要素。

传统方案中,有两点最为重要,即两点一线。两点指的是通信两端的网络芯片(卡)以及交换机。一线指的是基于包含光模块和光纤在内的光传输系统。信号的传输在光纤中进行,并且通过光模块与交换机相连接。

在传统的光通讯架构中,交换机带宽不断增加,而总链路功耗也随之快速增长。如下所示:

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

如下图所示。

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

光模块中的 DSP 以及交换机中的 ASIC 均为电芯片。若将 DSP 的部分功能转移至 ASIC 上,便可省去 DSP,从而降低功耗。另一方面,若光模块中的光芯片与交换机中的电芯片(ASIC)距离缩短至足够短,短到能够集成在一颗芯片上,那么就又解决了信号完整性的问题。如图所示:

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

Co-Packaged Optics(CPO)的出现是为了解决这一系列问题。它与传统基于 DSP 的可插拔光模块相比有着显著优势。

CPO 把光学元件直接和 ASIC 进行集成,把 DSP 芯片拿掉了,并且将 DSP 芯片的功能迁移到 ASIC(也就是交换机的 Switch 芯片)那一侧。这种集成方式使得功耗得以有效降低,同时效率和整体性能也得到了提升。DSP 从光模块中被移除,并且光芯片与 Switch ASIC 芯片被集成在一起,这使得二者之间的传输距离极大地缩短了。CPO 减少了信号转换过程中的延迟和功耗,所以它在高速数据传输中成为更具可扩展性和能效优势的解决方案。如图所示,在台积电工艺下,可插拔和 CPO 的能耗与延时都有提升。

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

这次发布的 CPO 交换机,其做法是去掉光模块,然后让光纤连接器直接接入交换机。

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

对于上图里典型的“AI 工厂”,拿 400K 的 GPU 数量当作例子,主要的功耗数据情况如下表呈现:

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

巨头入局,AI计算将迎来改变

事实上,英伟达并非业内首家发布 CPO 交换机的企业。此前,Broadcom 抢先发布了 25.6T 和 51.2T 的 CPO 交换机芯片,并且它还和业内厂商一起推出了对应的 CPO 交换机。

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_

Marvell 推出了 Teralynx® 的 CPO 方案。思科此前推出过 25.6T 的 CPO 交换机。

今天 NVIDIA CPO 方案正式推出了。其意义很重要,全球最重要的数据中心级芯片大厂中,在 Broadcom 和 Marvell 这两大顶级通信芯片和 AI ASIC 定制业务巨头之后,计算与通信双料芯片巨头英伟达也将产品化了。这些顶级巨头在产业方面影响力极大。它们在硅光和光电子领域投入并进行产品迭代,这对推动硅光与光电子产业的发展,以及实现计算系统的光化,都能起到非常重要的作用,这种作用远超推波助澜。

至此,其意义不再仅仅局限于交换机。硅光的光电合封,将会从面向交换的 CPO 拓展至 GPU 或其他 AI 计算芯片上,从而进一步提高计算芯片间的通讯效能。如图所示,Broadcom 有面向横向扩展的基于网络交换的 CPO 方案以及面向纵向扩展的基于 AI 计算核的 CPO 方案的示意图。

黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO__黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

事实上,把同样的思路运用到 Scale-Up 上,也就是把 AI 芯片和光芯片集成到一颗芯片上。这样一来,AI 芯片间的互联能够极大地提升传输带宽,能够降低功耗,能够提升信号完整性,并且还可以大幅度拓展节点数。以英伟达为例,若能实现 GPU+SiPh(硅光)的 CPO,既能增加 NVLink 的带宽,又能拓展集联的 GPU 数量,NVL 后面的数字或许就会超过 288 了。这种把 GPU 的基于电计算的硅芯片与基于光的硅光芯片进行异质集成的方式,就是面向 AI 计算的 CPO 。如图所示,传输每比特耗费的能量更低,且延时更短。

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

从互联的角度来看,业内会把这样的方案称作 OIO(Optical I/O)。

本次 GTC 发布了新的 GPU 架构 Rubin,下一代架构是 Feynman,预计 2028 年推出。到 2028 年时,基于 Feynman 的架构将成为具备 OIO 能力的新芯片。

硅光连接将会取代铜缆互联。 硅光连接有替代铜缆互联的趋势。 铜缆互联将会被硅光连接所替代。 硅光连接具备替代铜缆互联的能力。 硅光连接将会在互联领域替代铜缆。 铜缆互联的地位将会被硅光连接所取代。 硅光连接将在互联方面替代铜缆。 铜缆互联将被硅光连接逐步替代。 硅光连接的出现将会替代铜缆互联。 硅光连接的发展将会替代铜缆互联。

世界第一颗 1.6T 基于硅光的光互连接口

GPU/NVSwitch 将会实现光互连,如图所示:

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

对中国的意义和影响是什么?

近些年来,地缘政治格局发生了巨大的变化,充满了不确定性,而技术限制也成为了新闻中经常出现的情况。对于我国而言,基于电计算的算力芯片,一直都在高端工艺制程和封装方面面临着技术限制。从 2022 年开始,美国商务部逐年对其进行限制,起初是限制算力密度、算力上限和互联带宽,之后又限制晶体管数量、芯片面积和制程工艺,到最近更是直接推行了白名单制度。中国算力芯片在前行的道路上遇到了诸多困难。有众多业内精英投身于其中,也有大量天量资本投入其中。如今,虽然似乎有了希望的微光闪现,但产能方面仍然较为紧缺。同时,在高端技术与工艺方面,还需要不断地去追赶。

而光计算与光传输给了另一重希望。

前面提到,算力芯片自身算力的提升,如果依然是以电子计算的硅算力核(Si-Compute Die)为基础,那么就需要面对物理上的极限。从技术路线的可行性方面来考量,以光计算的算力核(Optical-Compute Die)作为基础,是提升算力能耗比的新方向。AI 芯片中的算力核换成光计算后,这种新型光电合封芯片基于光计算核与 OIO,会成为重要的技术路线和产品方案。

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO_黄仁勋GTC演讲中被忽视的重磅技术:即将改写AI工厂游戏规则的CPO

这种 AI 算力芯片的新形态,是下一阶段算力竞争的战略高地。

硅光芯片进行流片时,对 Fab 的要求不是很高,DUV 光刻机能够满足需求,甚至可以脱离光刻机而采取其他方式来达成更具想象力的产品形态。凭借对传统电芯片封装技术的积累,突破光电合封的难度不会比传统电芯片的难度大很多。从这个角度来看,CPO 所带来的趋势对我国是友好的。在光通讯这一领域,中国拥有处于世界前列的光模块厂商以及光芯片厂商。在交换机领域,国内企业的市场占有率比较高。近一两年来,硅光产业得到了更多的关注,硅光产线的建设也正在蓬勃发展。

但要正视差距。如前文所述,此领域处于靠前位置的依然是 Broadcom、NVDIA 和 Marvell 这些传统大厂,是它们在引领产业和技术的发展。在制造端,台积电作为传统硅电芯片的高端制造巨头,在 2024 年对外宣布了面向光电合封的技术方案,即 COUPE 方案,在当前时刻处于领先地位。

更需谨慎的是,去年美国开始关注中国的硅光产业发展,并且表示会实施出台限制政策。10 月 28 日,国会两党议员敦促美国商务部审查中国发展硅光子技术给美国国家安全带来的威胁。他们表示,硅光子技术是一个发展迅速的领域,能够加快人工智能的进步。

但东方已现白色,曙光已经展现。在 AI 产业的竞争里,一直能够留在牌局中是最为重要的战略目标。电芯片的时代正在奋力追赶,光芯片在开局良好的情况下,中国既不能也不会落后。

本文源自微信公众号“腾讯科技”,其作者为姚金鑫(J 叔),36 氪获得了发布授权。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275038.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息