1. 首页>>分享

DeepSeek凭成本优势卷动AI巨头,开源胜利改变AI世界

DeepSeek把两大“AI巨头”都卷到了__DeepSeek把两大“AI巨头”都卷到了

摘要:该行业通常认为,这两个“ AI巨人”被DeepSeek席卷了,开源的胜利正在改变AI世界。

DeepSeek带来了所有两个“ AI巨人”

自从其知名度以来,DeepSeek由于其成本优势而震惊了该行业,这为开发生态系统的发展奠定了良好的基础。

过去,大型模型的封闭源路线与成本密切相关。许多大型模型几乎选择在培训前阶段以任何代价进行投资,而DeepSeek选择误入歧途,并专注于从事这项工作后的加强学习。使用重复的高强度训练迫使自己不断调整姿势,理解逻辑并反思自己,直到结果令人满意。

以劳动力为例的OpenAI GPT-5,估计表明,该项目的一年的计算成本高达每半5亿美元。目前,该项目已经开发了18个月以上,成本巨大,但没有取得预期的结果。

DeepSeek把两大“AI巨头”都卷到了__DeepSeek把两大“AI巨头”都卷到了

对于许多国内大型模型公司来说,这听起来很警惕,这意味着,如果您想培训顶级模型,仅GPU的采购成本高达数十亿美元,并且“耗资赚钱”的程度可以部署100,000个卡拉集群甚至更难以想象。

相比之下,DeepSeek找到了一条具有低计算能力和高效率的路径,其训练成本仅为与OpenAI相关模型的十分之一甚至十分之一。

DeepSeek还对所谓的“开源是硅谷的精神”进行报复。它不仅为每个人免费下载的所有模型和论文都可以免费下载,还披露了培训方法,使每个人都可以散布数据并训练自己的培训。模型。

这意味着世界上所有相关的技术人员都可以根据现有能力来进行研发。在这一点上,将在这个新的生态系统中生产新技术和新应用。

DeepSeek于2025年1月20日发布了R1模型后,它在短短7天内增加了1亿新用户(包括网页和应用程序),成为历史上最快的AI应用程序。到2月1日,其日常活跃用户(DAU)超过了3000万大关,超过了Doubao(1695万),并接近Chatgpt的5323万。

从云服务提供商,电信运营商到大多数手机和汽车制造商,越来越多的公司都在努力拥抱DeepSeek。

这种cat鱼迅速激起了全球AI市场。两个“ AI巨人”决定改变他们的封闭源态度,让公众免费进行。

首先,1月31日,Openai推出了新的推理型号O3米尼,并进一步委派了免费许可。 Openai首席执行官Sam Altman首次承认他的错误在开源中,指出将来可能会发现不同的开源策略,并有望重新获得模型开源。

DeepSeek把两大“AI巨头”都卷到了__DeepSeek把两大“AI巨头”都卷到了

最新消息来自Baidu,该消息于2月13日宣布,从4月1日开始,Wen Xin Yiyan将完全免费。同时,从现在开始,Wenxin Yiyan将启动深入的搜索功能。此功能也将在4月1日开放。

DeepSeek把两大“AI巨头”都卷到了_DeepSeek把两大“AI巨头”都卷到了_

您应该知道,去年,罗宾·李(Robin Li)仍然是封闭式源头的坚定支持者。 “今天,无论是在中国还是在美国,最强大的基本模型都是封闭的来源。亲密的来源具有真实的商业模式,可以赚钱。只有赚钱,您才能收集计算能力并收集计算能力和收集人才。”

在不到一年的时间里,情况开始逆转。

开源的信心是什么?

实际上,许多人仍然对DeepSeek计算的快速和简单程度感到好奇。最重要的一点之一是它可以实现芯片的最低级别优化。 DeepSeek在发表的技术论文中指出,DeepSeek采用PTX(并行线程执行)编程,并且通过自定义的PTX优化,DeepSeek的系统和模型可以更好地释放基础硬件的性能。

与传闻中的计算功率限制相比,他们寻找具有成本效益的解决方案,DeepSeek实际上正在积极采用优化,使用PTX对某些SMS(负责GPU中的计算负责)进行编程,以使它们负责数据传输。更快地使多个GPU之间的数据传输速度解决了大规模计算中的主要瓶颈;同时,它还优化了其他操作,包括使用PTX计算梯度,以便相同的GPU可以在训练和推理过程中发挥10倍的作用。

除了芯片优化外,DeepSeek还为培训方法付出了很多努力。与传统的大型模型培训方法不同,它选择直接跳过监督的微调阶段,并通过规则驱动的强化学习专注于训练推理模型。

DeepSeek把两大“AI巨头”都卷到了__DeepSeek把两大“AI巨头”都卷到了

从DeepSeek V3基础的预训练模型开始,完全省略了监督的微调阶段。为了实现大规模的增强学习,研究团队使用了一种称为GRPO(小组相对策略优化)的方法。有些人利用现实生活生动地比较了这种数学原则的微妙之处。 “用外行的话来说,这是一组解决问题的学生。老师不再给每个学生一个分数,而是让学生自己比较答案。答案是更好的学生,而其他人则将从他们的角度来看。随着时间的流逝,整个团队将共同发展,并变得更加准确和一致。”

观察DeepSeek的开发路径,一种本地化模型,芯片优化和GRPO是两种魔术武器,提供了连续的光和营养,但仅营养就不够,而且良好的土壤更为重要。 DeepSeek全资的母公司Huanfang定量,最初押注AI很长一段时间,也是为数不多的国内定量私募股权公司之一,总计超过1000亿元人民币。他们既不缺钱也不是融资需求。与中国的大多数AI相比,可以说DeepSeek在商业化中完全是佛教徒,甚至在其中建立了许多营销和产品职位。

DeepSeek把两大“AI巨头”都卷到了_DeepSeek把两大“AI巨头”都卷到了_

同时,根据公共信息,DeepSeek研发团队有139人,所有这些都是基于当地的年轻团队。他们更多地了解这片土地真正需要什么。因此,上述快速迭代和尖端的实验结果具有生长繁殖的土壤。

凭借在工程技术和技术快速创新方面的卓越成就,DeepSeek的受欢迎程度绝非易事。实际上,这种布局始于六年前。它的母公司Huanfang量化花费了2亿元来建造Firefly One Super Computer集群,并于2019年在2022年默默地拥有10,000张A100图形卡。这是Chantgpt 3.5发行后的10,000张门票,可容纳10,000张门票。少数模型公司积累的丰富资源增强了他们对扩大领土的信心。

在这一点上,他们在V3中实现了令人震惊的成本效益。尽管R1达到了成本效益,但它也经历了具有很大影响力的新范式,成为AI领域的新明星。有些人甚至认为DeepSeek可以称为中国人工智能模型。 chatgpt时刻。对于该行业而言,DeepSeek的案子再次证明,在AI竞争中,垂直突破,开放合作和长期主义仍然是赢得比赛的关键。

中国技术公司的全球资本重估

DeepSeek引起的人工智能革命浪潮也改变了中国技术公司的估值叙事。

截至2025年2月12日,Hang Seng Technology指数ETF在过去一周中增长了7.67%。 2月13日,Hang Seng指数再次开放0.46%,Hang Seng Technology指数上涨了0.77%。 Bilibili-W,NetEase-S,Baidu Group-SW,SMIC和其他人上涨了2%以上。

根据《中国证券杂志》的报道,高盛(Goldman Sachs)最近发布了一份报告,称DeepSeek在中国人工智能(AI)公司中的出现正在敦促投资者加速他们对中国股票的购买。同时,高盛(Goldman Sachs)在MSCI中国指数上保持了过度对准评级,该指数预计今年将增长14%。

以前,中国技术公司通常被低估了。摩根士丹利(Morgan Stanley)的一份报告指出,中国技术公司的全球投资者估值系统仍在传统的互联网思维中,并且没有完全反映出他们在尖端技术领域的突破。以腾讯和阿里巴巴为例。两者的香港股票价值分别仅为19和15,远低于美国技术股票的价格可获得比率。

现在,DeepSeek确实已成为cat鱼。

在美国关于DeepSeek的报道中,经常出现一个高频词:“ Sputnik Moment”,也称为Sputnik Moment(该术语源自苏联于1957年10月4日成功推出的“ Sputnik 1”。人工卫星。这是人类历史上的第一个人造地球卫星。美国。

当时,这一事件对美国产生了巨大影响。然后,美国国家航空航天局(NASA)成立于1958年。美国动员了其民族力量,完成了月球着陆,并恢复了其在太空领域的领先地位,这使荆棘在其心脏中脱颖而出。这次,DeepSeek陷入了美国最核心AI领域的另一个新荆棘。

本文来自作者:Liang Siqi的微信公共帐户“ Phoenix Network Technology”,由36KR出版并具有授权。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274237.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息