1. 首页>>分享

DeepSeek时刻:2025年AI行业新转折点,V3与R1开源模型引领未来

AI行业上一次引起公众的震惊是2022年11月的Chatgpt出现。从那时起,AI行业的每一个重大变化都被称为“ Chatgpt Mist”。

这个词在2024年底被重写,“ DeepSeek时刻”出现了,这被视为AI历史上的新转折点。

在2025年春季音乐节的早期,DeepSeek(深入搜索)是一家位于中国杭州的AI公司,发布了两个主要的开源模型:V3(2024年12月26日)和R1(2025年1月20日)。

其中,DeepSeek声称V3接近封闭源模型OpenAI和Claude-3.5-Sonnet的gpt-4O的性能,这比开放式型号Meta的Llama 3更好费用仅为557.6万美元。推理模型R1的效果接近OpenAI O1,API(应用程序编程接口)的价格仅为OpenAI O1的3.7%。

这是一家创业公司,成立于2023年7月17日,手里拿着数十块Nvidia芯片,并培训了一个大型型号,其性能良好,约有7%的海外AI巨头成本。早在2024年5月的V2模型发布后,该公司就在中国正式发起了一场大规模的模型价格战,并由Byte,Alibaba和Baidu等主要公司进行针对。在今年年底,它成功地烧毁了海外的价格战。

DeepSeek的出现曾经导致全球计算能力概念库存暴跌。加上美国技术股票的总体下降,NVIDIA的股价下跌了近17%,其市场价值蒸发近6000亿美元,这是美国股票历史上最大的规模。 Openai和Google最近也紧急推出了最新的车型,AI行业是一个热门话题。

在DeepSeek的受欢迎程度之后,硅谷巨人队开始推翻桌子。 Openai说,它发现了DeepSeek“蒸馏” Openai模型的证据。人类创始人兼首席执行官达里奥·阿莫迪(Dario Amodei)发布了一条消息,否认了R1的突破,并呼吁加强中国的计算能力。出口控制。

本文抛弃了这次盛宴背后的情绪,试图澄清DeepSeek是否被“被高估”,而DeepSeek将带给国内和外国AI行业的涟漪效应。

如果您想戴皇冠,则必须承受重量

DeepSeek-R1已经在线超过20天,他收到的掌声越多,他收到的压力就越大。

AI行业从业人员林·吉克西安格(Lin Zhixiang)“丁格(Dingjing)”总结了DeepSeek声誉的来源:1。它完全免费使用。 2。与用户聊天时,将显示思维过程,这可以反向优化用户的询问表格并改善对话体验。 O1不宣布思维过程,因为原因可能是竞争对手会复制该过程并训练自己的模型。 3。开源技术论文和模型无预订,一些开源模型仍然会为自己留下最佳版本。

但是,几天前,由于受欢迎程度而来的用户发现,DeepSeek经常停机,几乎无法正常使用。原因是该公司的服务器受到了大规模的恶意DDOS攻击。截至发稿时,DeepSeek已恢复正常使用。

_稳定运行英文_稳定运行状态

DeepSeek意味着该服务正在运行稳定

当然,上述特征仅为DeepSeek提供自发用户通信的基础。 DeepSeek之所以受欢迎的原因在一定程度上是因为它允许海外AI巨人“打破防御”和“将桌子抬起”。

面对许多人的“ DeepSeek是否具有创新性”的问题,DeepSeek在其关于V3和R1:1:1的技术论文中做出了回应。V3模型使用了许多自我开发的技术来进行建筑创新,包括DeepSeekmoe + DeepSeekmoe + DeepSeekmla Architectect 。 ,MTP多语预测技术使低成本培训成为可能; 2。R1模型放弃了传统RLHF的HF部分(人类反馈强化学习),并验证了优先级和有效性,进一步优化了培训效率。

这也意味着DeepSeek证明它确实可以实现“培训成本(可以理解为净计算成本),以完成具有接近巨人的性能的模型。”

但是,半导体市场分析和预测公司半分析指出,557.6万美元的数量主要是指该模型的GPU成本。考虑到服务器资本支出和运营成本等因素,DeepSeek的总成本在四年内可能达到25.73亿美元。 。

不能忽视的是,创新成本下降的趋势已经开始,而DeepSeek只加快了这一过程。 ARK Investment Management的创始人兼首席执行官“ Mu Toujie”指出,在DeepSeek之前,人工智能培训的成本每年下降了75%,推理成本甚至下降了85%至90%。

Inno Angel Fund的合伙人Wang Sheng也有相同的观点。例如,如果年初发布的模型在年底发布,则成本将大幅下降,甚至可能下降至1/10。此外,作为一个封闭式模型,OpenAI还具有向外界披露的计算电源成本膨胀的可能性,因为有必要保留一些利润率并通过昂贵的故事来不断地增强资本市场以获得更高的投资。

但是,DeepSeek的价值不仅是“便宜的”,而且是“少龙男孩”的故事。

在Chatgpt问世之前,在中国面对计算能力控制之前,DeepSeek已经拥有10,000多个GPU储备。这与DeepSeek的创始人Liang Wenfeng在2008年开始探索的定量交易有关,因为要将深度学习模型应用于实时交易,必须保留大量的计算能力。从2019年到2021年,另一家公司Huanfang已连续采取了该计划。开发了“风口1号”和“风口2号”的AI集群,并积累了大量筹码和技术人才。

幻想为Liang Wenfeng提供了很多东西,足够的卡,AI和工程能力在模型级别上。 Liang Wenfeng还为Deepseek提供了很多东西,而不是以利润为导向,纯粹的好奇心和探索Agi的欲望,并且是开放的思想。一些参与者说,魔术广场曾经为算法研究机构提供了卡,以非常低价使用。

这样的故事是无法复制和美丽的,这也使DeepSeek赢得了整个国家的受欢迎程度。

谁在引起恐慌的恐慌?

在DeepSeek变得流行之后,一块石头引起了一千次浪潮,并且在中国美国AI产业连锁店上游和下游的公司受到了影响。

第一个首当其冲的聊天机器人(聊天机器人)AI应用程序。根据AI产品列表的数据,DeepSeek在2025年除夕左右有超过2000万活跃的用户,超过了国内douarao和Kimi,成为中国第一名。同时,DeepSeek在短短一周内就超过了1亿用户,而Chatgpt花了2个月的时间。

稳定运行状态__稳定运行英文

实际上,几乎在DeepSeek发行R1的同一天,Moon的Dark Side推出了自己的Kimi K1.5思维模型,并在Kimi免费开放。 Doubao应用程序还更新了对所有用户开放的实时语音呼叫功能,但是所有声音都不知所措,并且每日活跃的用户也受到影响。

Lin Zhi认为,这一事件完全表明用户对聊天机器人模型的忠诚度很低。一旦出现了更强大,更便宜,更快的模型,每个人都会迁移。

但是,从产品表格的角度来看,Doubao已经与产品中的多模式建模相关,而DeepSeek目前只有对话,并且体验不稳定。尽管DeepSeek在除夕(1月28日)发布了开源文本生成的图像(Wensheng Photo)Big Model Janus-Pro 7b,但尚未连接到DeepSeek网页和应用程序。

_稳定运行状态_稳定运行英文

稳定运行英文_稳定运行状态_

顶是豆面包,底部是深seek

在出现真正的杀手申请之前,竞争仍然是其背后的重要模型功能。在这个级别上,当前直接受DeepSeek影响的第二批公司是自我开发的大型模型。

从投资者的角度来看,Wang Sheng指出,自从DeepSeek于2024年5月发布了V2模型以来,为中国的大型模型发动了价格战,基本上已经达成了共识,这是在国内巨头中最好的大型模式Qwen,Doubao在2023年不容易使用,但在2024年下半年迅速改善。在初创企业中,DeepSeek和Kimi增长了最快,而其他五个小龙(Zero10,Minimax,Baichuan Intellignent和Zhi)有些转变,有些放弃了,有些人得到了国有资产的支持,但增长逐渐减慢,逐渐减慢,逐渐减慢,下降了六个小龙的模式基本上崩溃了。

在某种程度上,这些封闭的大型模型公司也面临与外国巨头相同的问题:培训成本可以降低吗?是否有更有效的训练方法? API Price战争仍可以进行吗?

至于DeepSeek是否会改变芯片市场的模式,许多行业内部人士表示,计算能力的斗争不会消失,但现在这是重估的阶段。 Nvidia以前很受欢迎,但是现在其股价刚刚恢复了合理的范围,但最终,Nvidia的价值仍会上升。换句话说,Nvidia不是DeepSeek的受害者。相反,随着模型应用程序方案的扩展,模型的“平等”越“平等”,对计算能力的需求就越大。

DeepSeek使每个人都从热情地追求AGI的上限,并回到现实,将重点放在行业的实施上。它使用非常低的成本来提供相对较高的功能,这可以促进工业链中的创新,并将受益于本地AI应用。以及AI硬件的开发。 “ 2025年将是AI商业化的第一年,”林Zhi说。

同时,DeepSeek证实了国内AI行业可以部分实现从筹码到模型的国内替代,从而增强了行业的信心。在春季音乐节期间,国内云服务制造商和GPU制造商接一个部署了DeepSeek。

但是,随着它被推到“祭坛”,DeepSeek的最大影响可能来自其自己的选择。

一些消息人士称,阿里巴巴计划投资10亿美元,以占Deepseek股权的10%,估价为100亿美元。这一估值超过了本月的黑暗面(33亿美元)和Zhipu AI(20亿美元)。阿里巴巴否认了这一消息,有些人指出,受魔术党的支持的DeepSeek从未寻求融资,但是市场仍然担心其他战略方正在与DeepSeek联系。

这可能是市场最少想要看到的结局。在这个春季音乐节期间,DeepSeek获得了“传播财富”,最初是一家免费公司。 Liang Wenfeng还向媒体提到,与大型制造商的模型最大的区别是,工厂将与平台或生态系统息息相关,我们是完全免费的。”有些人担心,如果DeepSeek这次从任何战略投资者那里赚钱,那么AI Six Xiaolong的故事可能会复制在其中。

DeepSeek的新范式,仍然有增长的空间

从更广泛的角度来看,DeepSeek的崛起如此受到海外巨人的重视的原因是对这两条道路的比较。

Wang Sheng解释说,AI行业在AGI的方向上经常有两种不同的途径选择:一个是“计算能力和军备”范式,它积累了技术,金钱和计算能力,首先将大型模型的性能提升到高点,并继续推高AGI能力的限额,然后考虑工业实施;另一个是“算法效率”范式,该范式旨在从一开始就实施行业,并通过建筑创新和工程能力推出低成本和高性能模型。

可以看出,过去,大型模型公司之间的竞争基本上是在“计算能力和军备”范式上押注。在此范式下,OpenAI,Anthropic,Google和国内AI Liu Xiaolong都是以资本密集型投资为导向的企业。

因为它需要大量资本,所以这意味着资本市场只能支持一些公司,而AI巨头的市场集中度远高于其他行业。

DeepSeek-R1的发布是因为美国总统特朗普宣布了一个耗资5000亿美元的AI基础设施项目“ Star Gate”,该项目已承诺将参加。 Microsoft早些时候表示,它将在2025年投资800亿美元,以投资于AI基础设施,而Zuckerberg计划在2025年在其AI战略中投资超过600亿美元。

无法忽视的市场环境是,过去,每个人都在追求AGI能力的持续增长。只要模型性能增长得足够快,无论如何进行数据工程优化,竞争对手都将无法赶上领先的公司。但是,到2024年11月左右,“即将消耗高质量的文本培训数据”的论点发出了行业警报。如果数据供应停滞不前,则模型培训也可能停滞不前。每个人都意识到以前的广泛培训模式确实可能存在瓶颈。即使您堆积计算能力,延长培训时间并提高数据水平,您的能力增长几乎也将结束。

_稳定运行状态_稳定运行英文

图像源/Unsplash

在此时间点,一些公司实际上认为“算法效率”范式目前是可行的范式,但DeepSeek首先做到了。 Wang Sheng说:“它的一系列模型还证明,当天花板仍在上升时,专注于优化效率而不是产能增长的范式是可行的。”

在这种背景下,DeepSeek似乎是一个“乱牌人”,美国AI巨人的“花钱花钱”的资本故事逐渐变得无效。

DeepSeek以开源模型进入市场,被认为依靠生态系统的力量来挑战领导者,为了避免被破坏,领导者通常越来越关闭。

林Zhi说:“实际上,中国与美国之间的主流路线已经完全逆转。”在阿里巴巴Qwen的表演赶上之前,世界上最主流的开源模型是梅塔的骆驼。在海外市场上,美洲驼曾经落后于Openai和Claude等封闭的源模型,但是在中国,目前站在大型模型上的模型实际上是在大型模型的旗帜下。开源模型。

但是,许多行业内部人士认为,这不应该太乐观,因为只能说2025年的DeepSeek在2025年有一个良好的开端,竞争仍在继续,并且差距仍然存在。

最近,几家海外巨头推出了新车型。 2月1日,OpenAI发布了最新的推理模型O3-Mini系列,这是OpenAI的首个推理模型,向自由用户开放。 2月6日,Google正式宣布了Gemini 2.0家庭更新,其中Gemini 2.0 Flash-Lite版本称为Google到目前为止最具成本效益的模型。

正如Liang Wenfeng本人所说,尽管特定的技术方向在发生了变化,但模型,数据和计算能力的组合保持不变。数据工程也是其中非常重要的部分。尽管Openai面对侵权,但它已经积累了自己的数据库。由于Tiktok事件的影响,Doubao还声称它不会蒸馏数据。 “本地数据库”已成为主要制造商的护城河之一。

此外,Wang Sheng提到,根据权衡曲线,DeepSeek选择的道路意味着其能量着重于工程优化,因此很难在能力上限上取得突破。 “它继续迭代现有方法,新版本可以改善多少?这是一个问题。”

自从他的学生时代以来,Liang Wenfeng向探索AGI和追求不断创新的热情表现出了他的热情。 DeepSeek只避免了无效或失败的尝试,但是我们不应该否认在以前的道路上,巨人队通过各种类型的人不遗余力。拓宽AGI边界的未知尝试。

巨大的海洋被深索克(Deepseek)搅动,涟漪不断扩大。

*应受访者的要求,文章中的林ZHI是一个化名。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274121.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息