自2024年底以来,DeepSeek依次发布了开源大语模型V3和R1,并且在许多评论中的表现都比主流开源模型更好,并且具有极其成本优势,从而大大降低了对硬件资源的需求。 1月27日,DeepSeek应用在中国和美国的Apple App Store免费下载排名高位,并在美国下载列表中超过了Chatgpt。
根据开发人员探索的技术报告,DeepSeek-V3的培训仅消耗266.4万h800 GPU小时,总成本仅为557.6万美元。 Antropic首席执行官Dario Amodi曾表示,GPT-4O的模型培训成本约为1亿美元,目前正在开发的AI大型型号的培训成本可能高达10亿美元。
同时,DeepSeek的API通话成本相对较低,百万个令牌的价格仅为16元。相比之下,GPTO1-2024-12-17 API型号的价格约为每百万产量令牌435元。这对预算的企业和个人开发人员都非常有吸引力。
与Openai的型号相比,花费了数亿美元的培训,毫无疑问,DeepSeek具有巨大的成本优势。
“ DeepSeek-R1的推出意味着中国公司正在超过AI领域的美国公司,而是开源模型超过了封闭的来源。” Openai首席执行官Sam Altman首次承认Openai是“历史上错误的一面”。
里昂(Lyon)发表了一份研究报告,称中国大陆人工智能公司DeepSeek宣布了一个大型模型,其AI模型培训基于行业开源AI算法,并且表现出良好的性能和相对较低的培训成本。
但是,该银行认为,由于DeepSeek的影响,美国超大规模企业的AI资本支出可能不会下降,因为DeepSeek的人工智能模型的培训总成本可能被低估,并且降低计算成本还可以增加人工智能应用和对推理的需求,这将进一步增加对计算能力的需求,并且材料行业的资本支出应继续。
计算功率需求增加,AI设备应用程序会加速
行业内部人士认为,DeepSeek推理计算能力成本的加速下降将提高在一定程度上使用资源并提高资源消耗速度的效率。因此,降低令牌呼叫成本实际上会增加其整体消费。
尽管代币将来可能更为普遍,但对推理计算能力的需求将显示出更高的要求。以DeepSeek-V3为例,它需要随附大量的日常活动用户服务请求,参数高达6710亿。随着模型参数数量的持续增加以及专家数量的增加,在培训和推理阶段,尤其是大规模数据处理。同时,有必要依靠有效的分布式计算体系结构,对计算资源的需求也大大增加了。
此外,由于DeepSeek需要不断加速迭代,因此研究和开发以及随后版本的优化本质上是对培训计算能力的巨大需求,并且还需要大量计算资源来支持模型的更新和改进。
另一方面,DeepSeek-R1允许用户进行蒸馏并实现端侧模型的培训,这将带来批量升级到终端模型功能,这将导致用户体验的显着改善。 AI的终端应用程序的实施也将更快地加速。我们迎来了末端申请付款的“时刻”。
里昂指出,DeepSeek表现出良好的性能和相对较低的培训和推理成本,这将有助于普及AI应用程序并加速AI货币化的过程,并最终使Edge AI设备的开发受益,这将在2025年成为人造智能货币化的起点。
市场重点还将从AI的第一阶段受益人(例如半导体和云服务)扩展到软件公司和人工智能本地初创公司,该公司将使用基本模型来构建智能工具将AI技术转换为2025年的实际业务价值。
Guohai证券分析师认为,DeepSeek有望通过成本优化和技术创新来促进全球AI应用和AI终端技术的创新和普及,并有望加速AGI时代的到来。例如,Iflytek的独立控制模型将具有下一代智能的语音识别,自然语言理解,机器翻译和其他功能,并将广泛应用AI技术在教育,政府事务,医疗保健,运输和其他领域中;作为应用公司的软件代表Wanxing技术已经完成了DeepSeek最新大型模型的深入改编。它的产品(例如Wanxing Miaoying和Yitu图)已集成了相关的AI功能,以为用户的创造效率和质量提供实际价值; Tols和Deepseek联手了。开发大型财务公众舆论模型,为金融机构和其他客户提供公众舆论监控,风险警告和其他服务。您可以在此阶段注意以下目标。
所有部门都连接到DeepSeek模型
面对DeepSeek的出现,各行各业的反应完全不同。
据媒体报道,意大利数据保护局加兰特下令在意大利禁止其聊天机器人,因为DeepSeek未能完全应对其隐私政策问题。此外,加兰特的订单可能会触发连锁反应。爱尔兰和比利时的数据监管机构已经开始调查DeepSeek的数据处理实践,法国数据保护局CNIL还将质疑提供DeepSeek聊天机器人的公司。
美国海军禁止其成员使用DeepSeek,这给出了“潜在的安全和道德问题”的理由。 DeepSeek的服务器可能位于美国以外。美国海军担心,当会员使用它时,数据可能会在存储和传输过程中被第三方获取或监控,从而导致军事敏感信息,个人隐私数据等泄漏,从而威胁到军事行动和人员的安全。安全。
这样的问题可能是正常的,但是由于DeepSeek已经是开源的,因此这些政府和机构可以在本地下载该模型,然后运行它。
无论它有多么有争议,实际上,各行各业都可以完成对DeepSeek模型的访问。
就海外平台,亚马逊AWS,Microsoft Azure和Nvidia而言,已经连接了一个。 AWS全球用户可以直接调用DeepSeek-R1模型。 Microsoft Azure AI Foundry将DeepSeek-R1纳入其AI服务系统。 NVIDIA使用其NIM微服务预览版。 DeepSeek-R1启动。
在中国,许多大型公司也开始与DeepSeek建立联系。 Baidu Smart Cloud Qianfan平台已推出了DeepSeek-R1和DeepSeek-V3车型,并推出了折扣和免费体验服务。 Alibaba Cloud允许用户直接使用PAI模型库部署,华为云和基于硅的流动启动了基于Ascend Cloud Service的DeepSeek推理服务,Tencent Cloud将DeepSeek-R1模型集成到其HAI平台中。
DeepSeek的突破还表明,当计算能力有限时,我的国家通过极端的技术探索实现了赶上海外AI技术的可行性在
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273878.html