1. 首页>>分享

英伟达GTC大会引爆AI热潮:黄仁勋带货AI芯片,现场一票难求,线上股价狂跌

作者|Xuushan编辑|伊凡

现场一票难求,线上股价狂跌。

“买得越多,省得越多,赚得越多。”

英伟达在 GTC 大会上,黄仁勋打出了今年 AI 界带货最强的 slogan。

在加利福尼亚州圣何塞的 SAP 中心,黄仁勋身着标志性皮衣快步走上台。他表示今年的 GTC 大会如同 AI 超级碗。AI 正在为更多行业和公司解决更多问题。作为科技行业的风向标,这场大会包含 1000 场会议、2000 名演讲者以及近 400 家参展商,参会人员超过 25000 人。门票在会前被炒到了万元的高价,并且早已销售一空。

图片

此次GTC大会对英伟达来说,是至关重要的一战。

外界关注的是,AI 的热潮是否已达顶峰?AI 芯片的销售是否在放缓?DeepSeek 证明了另一条性价比更高的计算路线后,仍在坚持大算力的英伟达能否坐稳 AI 基建王者的宝座?

会前投资者存在种种质疑。在黄仁勋为 GTC 准备了长达 120 分钟的演讲之后,这些质疑逐渐消散。英伟达直接公开了四年三代 GPU 架构路线图。Blackwell Ultra、Rubin、Rubin Ultra、Feynman 等芯片都登上了台。同时,还提及了 AI、数据中心、机器人、CUDA 生态等诸多进展。

投资者对此反应较为平淡。主题演讲结束后,英伟达的股价出现了略微的波动,且股价下跌了 3.5%。英伟达生态内的一些概念股,例如台积电、中电港、胜宏科技、鸿博股份等也有小幅的下降。在这些概念股中,英伟达国内算力板的第一供应商胜宏科技,其股价下跌了 5.75%。

业界表明,股价下跌的原因主要有以下几点:黄仁勋的演讲基本在华尔街的意料之中;许多新的技术进展已在今年的 CES 中有所涉及;黄仁勋提及的关于量子计算具身智能的部分,在短期内很难看到有实质增长的可能。

图片

英伟达半年来的股价走势 来源:TradingView

以下是今日GTC大会主题演讲干货提炼:

芯片全家桶进行了全面升级。Blackwell 芯片的销量加快了,其销量将会是 Hopper 的 3 倍。Blackwell Ultra 将会是首个拥有 288GB HBM3e 的 GPU,并且配有 GB300 NVL72 机架以及 HGX B300 NVL16 机架的组合系统方案,该方案将是今年下半年的主推产品。

首次公布未来三年的技术蓝图:2026 年将推出 Rubin 架构,此架构的 FP4 算力可达 100P Flops;2027 年,Rubin Ultra 能够支持 576 个 GPU 集群,并且 Rubin 的 AI 工厂性能或许能达到 Hopper 的 900 倍;2028 年将会发布 Feynman 架构。

英伟达与台积电一起进行光网络芯片的联合封装,并且会在今年下半年推出新版以太网芯片。

- 上线英伟达 Instant AI Factory,实现 AI 托管服务等。

推出 AI 推理模型系列:推出 AI 推理服务软件 Dynamo,其目的是为部署推理 AI 模型的 AI 工厂最大化 token 收益,能够将 DeepSeek-R1 模型生成 tokens 的数量提升 30 倍以上,每秒可处理超过 30000 tokens;推出全新的 Llama Nemotron 推理模型,同时帮助企业构建企业级 AI 数据平台。

开源机器人模型:它与谷歌 DeepMind 以及迪士尼携手打造,机器人上台进行了互动;在全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1 上亮相,使得通用人形机器人能够实现推理以及各项技能;

推出搭载 GH200 超级芯片的 CUDA - X 库,使其与最新的超级芯片架构协同工作,从而实现计算工程工具的速度提高 11 倍,计算量扩大 5 倍;首次设立量子计算日,同时对 cuQuantum 库进行升级,以推动量子计算研究。

会上,英伟达多次提到中国 AI 大模型 DeepSeek。英伟达提及 DeepSeek 整体的情况,这有利于它更快速地推动生态建设,并且不会给英伟达带来负面影响。黄仁勋针对此前股价大幅跳水的情况做出了回应。实际上,英伟达凭借每年迭代一代架构的速度,逐渐缩短了提升 AI 算力密度的周期。

生成式 AI 到了第三年,英伟达在 GTC 2025 大会上正式宣告了其构建 AI 全栈基建生态的野心。从硬件代际差方面来看,从生态垄断性方面来看,从行业标准制定权方面来看,英伟达围绕“技术 - 商业”双闭环的护城河在逐渐完善。在短期时间内,英伟达在 AI 基建领域几乎没有对手。

图片

四年三架构技术路线图揭晓!

黄仁勋:tokens是一切的基础

去年的所有情况都是错误的,扩展定律还远远没有结束。黄仁勋明确地说,扩展定律正在朝着超出人们预期的方向发展。当 AI 从之前依靠经验以及预训练数据来进行学习和推理,转变为采用思维链的方式,生成完整的推理步骤时,对算力的需求呈现出指数级的增长。

图片

他在现场进行演示,使用了 Llama 3.3 70B 和 DeepSeek R1 模型,向他们提出了一个排座位的问题。传统的Llama模型训练时仅能使用439tokens,之后给出的是错误答案。推理模型DeepSeek R1使用了8559tokens进行反复思考,其使用的tokens数量是Llama的20倍,调用的计算资源也是Llama的150倍,最终给出了正确答案。

图片

黄仁勋觉得数据乃是一切的核心。即便 R1 也耗费了 6080 亿的训练数据,然而下一代的模型提升或许需要数万亿的数据。在英伟达的叙事里,由 Scaling Law 所引领的大算力思路依然是有效的。此次大会上,英伟达提出的 Scaling Law 包含三大阶段,分别是 Pre-Training Scaling 阶段、Post-Training Scaling 阶段以及 Test-Time Scaling“Long Thinking”阶段。整个行业将会逐步发生转变。从 Agentic AI(AI 代理)开始,逐渐转向 Physical AI(物理 AI)。Physical AI 指的是让机器人、自动驾驶汽车和智能空间等自主系统能够感知、理解和执行真实世界中的复杂动作。因为它能够生成见解和动作,所以也常被称为“生成物理 AI”。

黄仁勋此次回应称希望大家走在对的方向上,这或许也是对之前 AI 奇点已到以及数据不再是 AI 模型提升关键等一系列回应的积极回应。今年以来,英伟达的股价下跌幅度超过 13%,其市值与 2025 年 1 月 7 日盘中所创的历史高点相比,已经蒸发了近 8200 亿美元。黄仁勋在这场股价保卫战中,选择直接面对市场对于英伟达股价以及增长潜力的质疑。

黄仁勋表明了数据和算力仍是 AI 时代最关键的两大方向之后,便开始展示自家的百宝箱。2025 年起,英伟达将在四年时间里依次推出 Blackwell、Rubin、Feynman 这三大架构系列芯片。

Blackwell Ultra 会承担今年下半年的主力产品。这个系列包含 GB300 NVL72 机架级解决方案以及 NVIDIA HGX B300 NVL16 系统。GB300 NVL72 机架会把 72 个 Blackwell Ultra GPU 与 36 个基于 Arm Neoverse 的 Grace CPU 相连接。Blackwell Ultra 预计能比前代产品(H100)给出 1.5 倍的 FP4 推理能力。这样能显著加快 AI 推理能力。

图片

可以看出,Blackwell Ultra 与上一代产品相比有一定提升。然而,其整体性能的提升并不十分令人惊喜,只能算是一个小版本的升级。

芯片性能明年可能会有“大升级”,承载英伟达希望的 Rubin 系列将于 2026 年问世。此前,黄仁勋称其计算能力可实现“大的跨越”。Rubin 主要是用发现暗物质的天文学家 Vera Rubin 的名字来命名的。

今天,英伟达进一步透露了关于 Rubin 系列的最新信息。明年,Rubin 会作为 GPU 的旗舰芯发布,同时 Vera 作为 CPU 旗舰芯也会同期发布。

英伟达在 AI 时代的野心或许可以用一个比喻来表现。英伟达正在构建一个范围广泛的 AI 帝国,这个帝国涵盖了市区、高速公路以及郊区。

CPU 就如同市区,GPU 犹如正在开发的高新区。在 CPU 和 GPU 之间,需要借助一个名为 PCIE 的通道来进行连接,而车流量在这里就代表着数据量。倘若数据量较大,那就需要对道路进行扩大,或者增加车道。只有 CPU 有权利决定这个分配。长久以来,CPU 生态一直被 Arm 和英特尔的 X86 所垄断。如今,英伟达向他们发起了挑战。

Vera Rubin 是英伟达 CPU + GPU 战略的重要举措。它将于 2026 年下半年发布。该产品将配备一个名为 Vera 的定制 Nvidia 设计 CPU。Nvidia 宣称,与它的前身 Grace Blackwell 相比,Vera Rubin 的性能有了很大提升,尤其在 AI 推理和训练任务方面。

图片

Vera 拥有 88 个定制的 ARM 结构内核,并且有 176 个线程。Vera 还具备一个 1.8TB/s 的 NVLink 内核接口,此接口用于与 Rubin GPU 相连接。相较于传统的互联技术,英伟达的这种互联技术速度更快,能够通过的“车辆”数量也更多。Vera 将会对现有的 Grace CPU 进行取代。英伟达透露,Vera 的新架构设计速度比 Grace CPU 快两倍。2021 年的 GTC 大会上,英伟达推出了第一款 CPU 即 Grace,其核心是 Arm 架构。

看回 Rubin 系列,Rubin 此次依旧采用拼接式设计。这意味着它实际上是由两个 GPU 在电路板上拼接而成,从而组成了一个新的 GPU。在性能方面,相较于 B300,Rubin 的计算性能提升了 3.3 倍,并且能够提供 1.2 ExaFLOPS FP8 训练。

Vera Rubin 能够提供 50 petaflops 的浮点运算的 FP4 推理性能,Blackwell Ultra 在类似机架配置下的性能与之相比,Vera Rubin 是它的 3.3 倍。

2027 年,Rubin Ultra 内部会有 4 个 GPU 。它能够支持 576 个 GPU 组成集群。在机架层面上,它比 Rubin NVL144 的配置要强大约四倍。同时,英伟达有相关计划。另外,Feynman 也将会使用 Vera CPU 。

从最新的技术路线图能看出,目前英伟达的 GPU 更新情况是基本维持在两年一个大版本升级,同时一年有一个小迭代,并且在稳步推进。而在 CPU 方向,新品节奏相对稍缓,可能大概 3 年左右才会有一个较大的版本升级。

英伟达自研的 GPU 和 CPU 生态在逐步完善。摩根斯坦利的统计显示,英伟达占据了全球 AI 专用芯片约 77%的市场份额。并且,英伟达一直是台积电的极为重要的客户,几乎获取了台积电的大半产能,具备强大的供应链优势。英伟达的 Rubin 运用了台积电的 3nm 工艺以及 CoWoS(Chip on Wafer Substrate)封装技术。这种最为先进的制造和封装工艺,表明这款芯片的性能会有很大程度的提升。同时,英伟达也会在与台积电的合作过程中积攒大量丰富的先进制程 IP。一位从事芯片行业的人士向硅兔君讲述,先进制程的产能通常是有一定限度的,大客户具备获得内测以及订单的优先地位。

英伟达一直在与各行各业的头部公司进行合作,借此了解行业内最为先进的技术,知晓创新的动向,并且掌握行业的 Know-how。可以说,在 AI 训练这一侧面,英伟达的芯片组合拳几乎没有其他力量能够阻挡。这是英伟达能够一路畅通无阻地登上 AI 基建宝座的核心要点,同时数据中心也为英伟达贡献了绝大部分的营收。

图片

英伟达2014-2024年主营业务收入占比变化

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275007.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息