1. 首页>>分享

AI教父黄仁勋访华,美国限制芯片出口影响几何?

本报记者 李玉洋 上海报道

三个月内,“AI教父”黄仁勋两次来到中国。此次他换下经典皮衣,穿上西装,进入公众视线。

近日英伟达总裁兼CEO黄仁勋来中国进行为期两天的访问。前一天英伟达披露美国政府告知其H20芯片出口中国需许可证且将无限期实施。另外美国商务部对AMD MI308这款中国特供产品及同类型AI芯片新增了中国出口许可要求

今年年初DeepSeek迅速走红。国内推理算力需求急剧增长。据外媒报道。腾讯、百度等大厂都增加了H20的采购订单。即便H20性能遭到严重限制。美国政府限制H20向中国出口。英伟达称,预计2026财年第一季度业绩将承担费用。此季度对应自然日期截至4月27日。费用为55亿美元,约合人民币400亿元。这些费用与H20产品的库存、采购订单及相关储备有关。

过去半个多月 全球半导体产业链备受冲击 这是在美国加征关税的大背景下 “行情变化太快” 英伟达国内代理商思腾合力的一名销售人员告诉《中国经营报》记者 一款搭载8张H20(内存141G)的推理服务器 目前现货售价约140万元 今年年初价格在100万元左右 该销售人员还表示“价格可能后面还会涨”

美国全面封杀英伟达H20及同类型AI芯片对华出口。对此有分析指出,国内AI芯片厂商获得了前所未有的市场空间。可用来验证自身产品的性能。验证可靠性。验证生态兼容性。验证供应链的稳定性等。这对国内是利好的。因为企业对AI的诉求不断增加。且中国智算中心市场仍在增长。对国产化的要求颇高。行业研究机构Omdia的人工智能首席分析师苏廉节向记者表达。

数据中心收入将下降8%至9%

需要说明的是,2023年10月,美国新一轮限制对华出口AI芯片的措施生效。之后,H20成为英伟达能够向中国客户合法销售的特供版AI芯片。

据了解H20基于英伟达Hopper架构它有两种内存版本分别是96GB的HBM3和141GB的HBM3e与H100相比其性能大幅缩水约80%并且禁用张量核心限制了超频和集群扩展有消息称H20 96GB版本已停产141GB版本更适合超大规模推理集群部署

141GB版本的H20,其FP16精度算力不到H200的十分之一。不过它的显存极大。正因如此,该版本因“算力与显存配置畸形”引发讨论。再加上国内AI芯片竞争激烈,H20的市场竞争力大幅下降,质疑声不断。

然而,DeepSeek很火爆。H20 141GB版本凭借强化的显存和带宽,8卡总显存达1128GB。它原生支持DeepSeek-R1 671B满血版模型的FP8精度。能流畅运行千亿参数规模的模型推理任务。成为当前中国市场适配大模型推理的热门选择。

DeepSeek证实了H20很出色。据说,之前腾讯、字节跳动、阿里巴巴等众多中国巨头斥资160亿美元购买H20。所以,主要用于推理设计的H20,成为今年第一季度国内销量最佳的AI芯片。在此期间,市场上一直有“H20即将被禁”的传言,如今终于有了定论。

值得一提的是,面向中国市场的H20 141GB版本没有DGX系统。DGX系统是英伟达直接提供的AI服务器。比如DGX H100/H200就属于DGX系统。它包含完整硬件。像GPU、CPU、网络等。还预装软件生态。比如NVIDIA AI Enterprise。其定位是“即插即用”的AI基础设施。

依据公开消息 英伟达H20主要是作为合规特供的GPU模组 以HGX形态提供给中国市场 供OEM厂商将其集成到自有服务器产品里

上述英伟达国内代理商称 他们的H20现货产品是固定配置 配置为2×8558/16×64G/2×960G/4×3.84/8×H20 141G 其中8558是最新一代Intel 8558P处理器 虽说不知H20现货何时不在国内销售 但其表示不用担心保修

此次H20芯片对中国出口实施管制。这意味着英伟达已量产的最近三代架构的数据中心级AI芯片即GPU,无法进入中国市场。不管是最新Blackwell架构的B100/200。还是高端版H100/200、A100等。又或是特供版H800、A800以及H20。

黄仁勋承认 美国政府加强芯片出口管制 这已对英伟达业务产生重大影响 中国是英伟达极为重要的市场 英伟达会继续竭尽全力优化产品体系 使其符合监管要求 并坚定不移服务中国市场

有消息传出,英伟达专门供应给我国的H20这一单款产品,在2024年为该公司中国区带来了170亿美元的年营收,占比达70%。摩根士丹利的分析师调低了英伟达的营收预期。原因是担忧美国对中国最新的芯片出口限制会对英伟达产生影响。他们预估在未来几个季度,英伟达的数据中心收入会下降8%至9%。

构建国产算力版图

怎样评估DeepSeek对算力生态的影响?业界存在两个共识。其一,DeepSeek让蛋糕变大了。其二,模型训练需求会远小于推理需求。当下,英伟达的AI芯片在训练方面表现最为出色,不过推理芯片的最佳选择仍未确定。

IDC觉得,借助适配DeepSeek,中国本土AI芯片在软件生态领域达成了突破,渐渐完善软件生态。这给本土AI芯片在市场里的竞争力予以了有力支撑,与此同时还推动了本土厂商的技术交流以及资源共享,打破了国产芯片生态建设的僵持局面

美国政府进一步管制对华出口AI芯片。这会倒逼中国企业更多使用国产AI芯片。国内AI芯片行业直面替代大考的机会真的到来了。

有观点指出 国内AI芯片与国际先进水平 大约相差1.5代 国内多数AI芯片性能 已接近英伟达A系列 最新一代 接近H系列

谁最有可能替代英伟达GPU呢?华为的昇腾系列芯片是当前备受瞩目的本土选项。而且在实际部署方面,它走得最远。尤其是昇腾910C代表的最新一代产品,正成为中国构建本土AI基础设施的核心。

据Huawei Central、TrendForce News和Reddit等平台研究分析,昇腾910C由两个昇腾910B芯片通过共封装或芯粒技术组合而成。其计算能力显著提升,在FP16精度下达到800 TFLOP/s的计算能力,内存带宽为3.2 TB/s。性能可达英伟达H100的80%

其超节点在规模方面已达到较高水准。在推理性能上也已达到比肩英伟达NVL72超节点的程度。这和华为昇腾910C芯片紧密相关。华为昇腾910C芯片是构成该计算系统最核心的部分

苏廉节称 最近有消息传出 华为下一代昇腾920将会推出 他还表示 受制裁影响 昇腾920性能仍无法与最顶尖的GPU相比 不过预计会出现爆单情况

此外 华为把芯片能力拓展到系统层面 借助CloudMatrix这样的计算系统聚合算力 近日 华为云推出CloudMatrix 384超节点 并宣布在芜湖数据中心规模上线

尽管当下华为昇腾910C在国内应用及替代方面处于领跑地位。但实际上在国内AI芯片领域。互联网大厂阿里巴巴、百度、腾讯都已着手布局自研AI芯片。在纯芯片厂商中。寒武纪、海光信息等是上市公司。同时还涌现出一批企业。像摩尔线程、壁仞科技、瀚博半导体、沐曦、燧原科技、天数智芯、地平线等。这些企业兼具技术沉淀与创新活力

可以这么讲,美国商务部的禁令清单每延长一点,中国本土AI芯片厂商的订单就增厚一些。寒武纪有云端训练卡,地平线有自动驾驶芯片,华为有昇腾生态。它们正以美方禁令倒逼出的超线性速度,填补着算力版图的裂缝。

除了上述芯片企业致力于构建国产算力外,记者还留意到,有一些处于中间层的 AI 基础设施公司,它们也在为用好国产算力贡献力量。

清华系有一家企业叫清程极智。清程极智的CEO是汤雄超。汤雄超此前接受媒体采访时讲过,DeepSeek模型采用的FP8数据格式和英伟达H系列卡紧密关联。不过当下多数国产芯片没办法原生支持FP8。

汤雄超认为 硬件层面产品的代际差距在这个层面被拉大了 公司始终在思考发挥Infra层的作用 通过软硬协同 将优秀的国产大模型和国产硬件更好协同起来 以及把市场上的闲置算力更好地用起来

今年年初,清程极智和清华共同开源了大模型推理引擎“赤兔”。借助赤兔的部署,多数英伟达老卡、旧卡以及国产芯片都能支撑DeepSeek满血版。并且在首期开源版本里,与国际主流开源推理引擎相比,即便算力减少一半,速度依然能够翻番。

从短期看,赤兔达成了DeepSeek FP8精度模型在存量GPU上的无损且高效部署。从长期看,赤兔这些模型推理引擎的开源是形成国产大模型、国产算力和国产引擎闭环的必要环节。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275736.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息