1. 首页>>分享

国产AI大模型DeepSeek-R1发布:技术普惠理念引领全球AI竞技场新潮流

国产 AI 大模型 DeepSeek 发布了新一代推理大模型 DeepSeek-R1。这款新一代推理大模型在全球 AI 竞技场中,投下了技术普惠理念的“深水炸弹”。

文丨万宏蕾 编辑顾佳贇

图片

2025年,中国人工智能产业跑出了“加速度”。3 月 5 日,国新办举行国务院政策例行吹风会。《政府工作报告》起草组成员、国务院研究室副主任陈昌盛表示,今年政府工作报告提出持续推进“人工智能+”行动。这是要抓住人工智能技术突破的机遇,让我国数字技术与制造优势、市场规模优势充分结合起来,推动人工智能大模型广泛应用,努力让人工智能真正能够赋能各个行业、走进每一个家庭。

2025 年 1 月 20 日,国产 AI 大模型 DeepSeek 发布了新一代推理大模型 DeepSeek-R1。这一发布在全球 AI 竞技场中产生了重大影响,就如同投下了技术普惠理念的“深水炸弹”。当下,深度适配、开源以及差异化竞争成为了热点。

在人工智能发展的进程里,GPT在自然语言处理方面取得了突破;Sora展现出了多媒体创作的潜力;DeepSeek-R1在数学、代码、自然语言推理等任务的性能上有了显著的提升,这更是一场让人极为震撼的变革。复旦大学计算机科学技术学院的教授张奇,同时也是博导,他告诉《瞭望东方周刊》,这场变革为全球通向 AI 未来开辟了新路径,并且给 AI 大模型的落地普及打开了更广阔的空间。

DeepSeek 在多家医院完成了本地化的部署工作,微信对接入 DeepSeek 进行了测试,一些城市的政务系统已经接入了 DeepSeek……DeepSeek 的开源生态吸引了大量的开发者、机构以及企业参与其中,并且还激活了整个人工智能的产业链,无论是云服务厂商,还是芯片公司,亦或是下游的应用层,都纷纷开始入场进行部署以及适配的工作。

大模型取得突破,推动了产业实现爆发式增长。国产 AI 技术正在加速进行创新,并且加速落地。

图片

比亚迪“璇玑架构”全面接入DeepSeek

DeepSeek加速技术普惠

DeepSeek 开源模型凭借自身的开放性、高效性以及易用性,正在成为推动 AI 技术普惠化的重要力量。张奇表示,DeepSeek 具有高效的推理与扩展能力,这使得它能够在云、边、端以及多行业场景中快速渗透。

我们的大型企业客户对智能化需求具有特殊性。这些需求体现在场景垂直度要高,任务复杂度要强,数据安全要求要严。达观智能问答系统全面接入了 DeepSeek 大模型,该模型涵盖了各个蒸馏版本和满血版本。通过此系统,能够实现全版本的灵活调用以及与知识库的深度联动,这就相当于为企业打造了一个具备可配置、可思考、可行动功能的智能中枢。”达观数据CEO陈运文告诉《瞭望东方周刊》。

当企业遭遇问题时,系统能够将 DeepSeek 模型与 RAG 框架相结合。RAG 是一种结合了检索和生成技术的模型,主要用于自然语言处理任务中。通过这样的结合,系统可以从海量数据中精准地召回素材内容。然后,利用 DeepSeek 强大的深度思考和推理能力,最终呈现出清晰且完整的结果。后台配置里,企业还可以自行选择调用基础模型。”陈运文说。

在供应链管理场景中,达观智能体可以自主拆解企业级任务,同时能同步协调订单数据解析、供应商资质核验、物流异常预警等子任务,企业借此能够实现跨系统业务流程效率提升 50%。”陈运文说。

下一步,达观数据会打造办公智能体。这个智能体能够理解用户的需求,并且可以给出准确的答案。它还能够自动执行一系列复杂的任务,从而实现企业内部工作流的全面自动化。陈运文表示。

2025 年 2 月 12 日,国网信息通信产业集团有限公司自主研发的该平台接入了 DeepSeek 大模型。

2 月 15 日,中国华能集团有限公司将 DeepSeek 系列模型完成了本地化部署。随后,该集团在“iHN+”移动门户中推出了“睿智小能”AI 助手。目前,基于通用知识,将企业数据库(包含规章制度、故障分析等)与 AI 助手相结合,利用预置提示词,AI 助手实现了知识问答这一功能,也实现了公文拟稿的功能,还实现了智能校对的功能,同时实现了文件解读的功能以及科研辅助的功能,从而高效地辅助了日常办公与管理。华能数字化部相关负责人表示。

目前有多家能源企业将 DeepSeek 进行了深度融入业务。例如,在发电厂的设备检修方面,在虚拟电厂的能源调度方面,以及在合规审查等方面,AI 技术都已经嵌入到了能源生产和管理的整个链条之中。

图片

DeepSeek 于 2025 年 2 月 13 日正式在乌鲁木齐登陆。该部署上线工作在皖疆绿色算力科技产业园完成。图中展现的是当日该产业园的工程师在 2A 机房进行巡检的场景。

能源行业的生产端是极为复杂的一个环节。其品类包含煤电、核电、水电、光伏、风电、生物质能等。这些品类分布范围广泛,产出情况复杂且多变。在电网端,它更是现代工业体系当中数据量最大的体系之一,变动量也最大,复杂度更是最高。中国电子商会副会长熊焰进行分析,例如电力交易系统这一场景,其中有数以万计的发电侧,包含稳定的煤电、水电以及核电,同时还有不稳定的风电、光伏。在需求侧方面,又遭遇着用户各式各样的需求。从进行预测、作出调整,到开展交易、实现优化,接入大模型之后,整个电力交易系统就好像拥有了一个更为聪明的大脑。

患者走进医院后,将自身不舒服的部位告知 AI 医疗机器人。没过一分钟,就医路径就出现在屏幕上,告知患者需先前往一楼 A 区抽血,接着前往 B 区拍摄胸部 CT。患者检查完毕回到家时,检查报告和诊断结果已传输到手机上,药品在当晚就配送到家。上海市第六人民医院金山分院副院长殷峻如此描绘道,类似这样的自助式医院或许不会太遥远了。

殷峻是内分泌代谢科的专家。在他的印象里,全球早期 AI 医疗应用具有里程碑式突破的领域是糖尿病视网膜病变读片。如今,DeepSeek 结合医院内部的医疗数据,有希望训练出更多的治疗“最优方案”,并且这些方案带有各医院的“标签特色”。

统计显示,到 2025 年 3 月这个时间点,国内有超过一百家三级医院已经公开宣布完成了 DeepSeek 的本地化部署。这些医院分布在北京、上海、广东、江苏、浙江等二十多个省份。DeepSeek 正在从各个方面渗透进临床决策支持、病历的生成与质控、疾病的科普、健康管理、科研辅助以及医院管理等各类医疗场景当中。

图片

四川省人民医院借助“DeepSeek 大模型”,把人工智能(AI)技术运用到看病的整个流程当中。图所展示的是该医院的医生借助诊室听译机器人来对患者进行问诊,并且能够迅速地生成病例报告。

前不久,某建筑央企的智能问答项目由浪潮海岳承建并正式上线。浪潮海岳大模型平台与 DeepSeek 大模型深度结合后,制度查询的平均耗时从 15 分钟缩短到了 10 秒。经过训练,海岳大模型对《工程项目管理办法》等桥梁施工领域专业文件的理解准确率达到了 96.5%。在跨部门协同方面,系统能够自动关联制度负责人,将专家响应时间从 2 小时缩短为 5 分钟。

另外,浪潮海岳大模型在面向桥梁施工的领域,突破了多维度的知识库构建技术;在面向智能编制方面,突破了多智能体协同等多项关键技术。它构建了私有知识库,进而打造了该建筑央企专属的施工方案智能编制平台。方案编制时间相较于传统人工方式从数周缩短到了 45 分钟。人力投入减少了 50%以上。能保证 100%符合国家和行业规范。人工错误减少了 90%以上。施工风险识别率提升至 90%以上。浪潮海岳相关负责人表示。

一方面,海岳大模型的应用场景能够进一步向专业垂直领域深入渗透,这样能让处理专业型、知识密集型任务的能力得到大幅提升,从而更好地切入高门槛的场景应用;另一方面,它也为海岳大模型在横向方面扩展应用领域和应用行业,提供了一种成本相对较低且效率较高的垂域大模型训练范式。浪潮通用软件有限公司海岳大模型的研发负责人周祥国表示,海岳大模型定位于企业服务垂域。该模型在接入 DeepSeek 之后,解锁了企业智能化的新高度。

瞬间构建AI智能体

在国产大模型 DeepSeek 发布之前,我们在 2024 年 12 月底完成了产品更新。春节后,我们在 Agent 方面率先采取行动。我们将 Agent 全线接入 DeepSeek ,并发布了 Agent 产品家族。这个家族包含 RPA Agent(iBotX)、智见分析 Agent、Hyper Agent 和 Agent Store - 100 中心这四款核心产品。这些产品为企业的智能化转型提供了全方位的解决方案。上海容智信息技术有限公司的 CEO 柴亚团向《瞭望东方周刊》进行了告知。

容智信息在 2016 年于上海成立。经过两年多的时间进行技术研发。到 2018 年,完成了自主知识产权的国产 RPA 产品 iBot。

很多公司还在摸索如何让 DeepSeek 与公司业务深度适配之际,我们已能够迅速拿出产品,使其适配 100 多个行业场景,这些场景涵盖了金融、零售、制造、运营商、物流、现代服务业等多个领域。柴亚团表示,平台根据行业与部门进行细分,用户登录后可以轻松浏览到众多精准匹配业务场景的 Agent,只要点击“聘用”,就能在线体验标准版。用户可以进行个性化定制,还能实时跟踪 Agent 的 KPI 表现,从而真正开启人机协同办公的新模式。

DeepSeek 具有国产化与自主可控的优势,还具有多模态与场景适应能力,同时具备高效推理与低成本部署的优势。它在确保高性能的情况下,把成本压缩到了行业平均水平的 60%,为中国企业大规模应用 AI Agent 开辟了更可行的路径,也展现出了广阔的前景。

目前,有许多科技公司推出了针对 C 端(终端用户)的通用型 AI Agent 产品。在这些平台上,用户仅仅通过简单地进行描述,就能够生成语音陪伴助手、外语练习助手、图像生成助手等。这极大地提升了生活的便捷性。然而在 B 端(企业端),Agent 首先引领的是企业软件架构的革新。柴亚团表示,我们将 RPA(机器人流程自动化)视为自身的基因,在 B 端市场进行深入耕耘,把关注点集中在企业的核心执行层。

图片

2024 年 9 月,上海容智信息技术有限公司的 CEO 柴亚团正在对公司的 AI Agent 企业级解决方案进行介绍。

传统企业软件依靠后端系统以及数据库来进行管理,其业务数据和交互都集中在后端服务器上,这样就使得架构变得复杂,并且运行效率也受到了限制。然而,AI Agent凭借着智能化的能力,把数据库的交互、用户请求的处理以及业务流程的执行进行了深度的融合。这种高度的集成和智能驱动,让 AI Agent 替代了传统的人工编程以及分散管理模式。它不仅简化了企业的软件架构,而且从根本上提升了系统的灵活性,同时也增强了系统的智能决策能力,给企业带来了更加敏捷、高效的运营模式。

假如企业有员工离职,以往需要去各个部门办理相关流程。如今只要构建起 AI 智能体,流程就会大幅度简化。当新员工入职时,能够轻松地完成账号的重新创建以及资产的恢复。新员工可以通过知识库智能体轻松掌握流程信息。

容智 iBotX 数字员工 RRPA Agent 另外,它在 RPA 的基础上融入了大模型能力。这使得它不仅具备人机对话、思考、推理、内容生成和总结等智能化能力,还结合了 RPA 丰富的动作执行能力,从而能够高效应对大量端到端的复杂业务场景。这一升级拓展了能力边界,幅度还很大。它提升了灵活性和实用性,提升效果很显著。它重新定义了人机交互。它为 RPA 这双灵巧“双手”装上了智慧大脑。它与大模型强强联合。这些都为业务流程自动化带来了前所未有的可能。柴亚团说。

柴亚团回忆道,实际上,我们研发智能体已经有两年多的时间了。在过去,很大的一个问题是受到大模型能力的限制,导致智能体成本较高且输出不稳定,以至于都不好意思将其拿出来给客户使用。而在 DeepSeek 发布之后,这款基于 DeepSeek 的智能体终于能够在实际场景中真正被使用了,它不仅是开源免费的,还具有速度快、输出稳定的特点。

现在,容智创新将大语言模型与智能体技术进行了融合,打造出了开箱即用的 Hyper Agent 专家级智能体开发平台。借助可视化配置界面,业务人员不用编写代码,仅仅进行简单的修改,就能够在很短的时间内完成 Agent 的部署,达成业务流程的智能自动化,切实做到了“所想即所得”。柴亚团表示。

6个月与6天

“我要发自内心地感谢DeepSeek。宁波云锦微智能科技有限公司(以下简称“云锦微”)的创始人、CEO 王文艺向《瞭望东方周刊》讲述道,之前他在人工智能行业从事计算机视觉工作时,大家觉得行业市场规模如同夜空里的星星那般。然而,后来 GPT 出现了,大家便认为 AI 市场规模达到了月亮那般大小。而 DeepSeek 出现后,大家觉得它将市场规模放大到比太阳还要大。

云锦微于 2021 年 6 月成立。它是一家科技公司,专注于研发具身智能体操作系统。在工业生产里,不同行业的场景对识别目标物的需求极为多样且细碎。在计算机视觉时代,存在着很多无法被覆盖和满足的算法需求,像垃圾分拣、质量检测、运维检修等等。而大模型技术的出现,为这些需求提供了更便捷、成本更低的解决方案。王文艺解释说,我们的目标是让每一个设备都能拥有大模型的助力。因此,低成本以及高性价比成为了云锦微的一个显著特色,特别是在 AI 芯片的国产化适配领域方面。

目前,云锦微已助力企业开发者客户在能源场景实现了商业化落地。目前,云锦微已助力企业开发者客户在水务场景实现了商业化落地。目前,云锦微已助力企业开发者客户在交通场景实现了商业化落地。

2025 年 1 月,科大讯飞与云锦微达成了生态投资合作协议。双方会在多模态技术领域展开合作,也会在全球市场拓展方面进行合作,还会在投资机构对接等方面开展合作,一起推动具身智能体在各个行业得到普遍应用。

从商业角度而言,DeepSeek 首先使我们的成本得以降低。当下,模型计算与使用方面仍存在成本,然而知识使用成本已降至零。王文艺表示,其次,它借助开源免费这一方式,将慢思考能力与深思考能力融入到了各个行业之中。

最重要的是给我们带来了更多商业机会,能够把当下的行业经济规模至少扩大到原来的十倍,未来还会呈指数级增长。春节后一开工,我们接到的咨询量就迅速增多了,商业方面也快速地扩大了,很多政府部门和事业单位都在咨询把内部流程知识库接入 DeepSeek 这件事。

图片

2025 年 2 月 26 日在北京市丰台区,综合窗口的工作人员借助 DeepSeek 大模型版“丰小政”来解答市民的咨询。

春节期间看到 DeepSeek 爆发后,王文艺表示自己的第一反应是市场要变天了。他还说,以前要成交一个客户,需要有专业的业务顾问以及技术专家团队与客户进行沟通,要了解客户的业务目标、流程、应用场景和功能期望,然后给出关于智能体应用的可行性分析和战略建议。从他们初步了解客户到客户真正下单,这个过程至少需要 6 个月。现在我们开发了一个基于 DeepSeek 的小程序,它类似于数字销售员。专业的数字销售会逐步引导客户,帮助客户测试我们的产品,让客户判断我们的能力。在大约 6 天的时间里,就能筛选出我们与客户是否匹配。接入 DeepSeek 后,一周时间内的订单量就和以前一个月的订单量相当。

最近市场上都在一窝蜂地做 DeepSeek 私有化部署一体机,这些一体机的水平高低不一。这与上世纪 90 年代初专业人士组装 PC 机的情形相似。王文艺表示,目前有很多中小微企业对 DeepSeek 十分好奇,然而它们的预算不高,自身也没有专业的 IT 开发团队,想要尝试却无人帮其进行 DIY。在这种情形下,DeepSeek 一体机能够开箱即使用,并且其需求量是非常大的。

我们帮助客户配置 DeepSeek 一体机。我们会根据客户对智能体的性能需求和应用场景需求,对处理器、内存、存储、显卡等关键硬件组件进行选型和优化。同时,我们还会免费提供给客户多模态底座、大模型和 AI 开发工具。我们希望客户在未来需要进行多模态整合时,能够看到我们的能力。王文艺表示,在我们还没有完成推广视频的制作,没有通过代理商渠道进行推广,也没有进行广泛推广的时候,当前的咨询量已经是非常大的。

2025 年,行业会呈现爆发式的增长态势。人工智能也将真正开启“大航海时代”。在这之前,大家还都只是在港口处摇旗呐喊,想着要去探寻新大陆。而如今,不管是大轮船还是小舢板,都能够尽快地出海远航了。王文艺如是说道。

通用智能尚在路上

DeepSeek 在 AI 领域能够崭露头角,这与它在技术层面的诸多创新是分不开的。这些创新点成为它突破传统、实现飞跃的关键因素。张奇表示,DeepSeek 在研发过程中把大量国内互联网信息进行了深度融合,从而使它对中文语境具有高度的敏感性,能够精准地把握本土用户的需求和语言习惯。处理中文翻译任务时,它能充分考量中文语言的丰富内涵与文化背景,给出更准确、自然的翻译结果。翻译具有中国特色的成语、俗语时,DeepSeek 能深入领会其背后的文化寓意,将其准确译成外文,使外国用户领略到中国文化的博大精深。在语义理解以及多轮对话的场景里,DeepSeek 的表现更为自然流畅。它能够更优地理解用户的意图,给予更具个性且精准的服务。例如在智能客服场景中,它可以迅速理解用户的问题,同时给出有针对性的解决方案,从而极大地提高了用户的满意度。

DeepSeek 是中国团队自主研发的成果,它在中文理解与生成方面具有天然优势,这是它与其他国际 AI 产品的一大区别。张奇分析道,一些国际知名的 AI 产品在上下文理解、创意写作等方面表现良好,但在处理中文信息时,由于对中文语境的理解不够深入,往往会稍显滞后。这使得 DeepSeek 在本土市场具备独特的竞争力,能更好地契合国内用户的需求,进而为推动中文自然语言处理技术的发展贡献重要力量。

我们必须清醒认识到,DeepSeek 很强大,然而它距离通用智能的目标还很遥远。

通用智能代表着人工智能发展的终极理想。它指的是一种具备人类级别的认知能力的人工智能系统,这种系统能够理解、学习并且应用于广泛的任务领域。这表明它不是局限于特定任务或领域的,而是如同人类一样,具有广泛的适应性和灵活性,能够处理各种类型的任务,无论是日常的生活琐事,还是复杂的科学研究,都可以应对得很自如。

大语言模型包括 DeepSeek 在内,其底层逻辑依然是统计机器学习。其运作方式为传统的喂数据、训练以及输出结果的模式。在技术层面上,DeepSeek 在某些任务上能有出色表现,然而本质上它只是一个被训练出来的智能模型,并非真正意义上的智能体。张奇分析道,DeepSeek 在一些复杂问题方面能够展现出强大的计算和推理能力,像在数学任务以及代码处理等方面表现得很出色。然而,对于那些没有在训练数据中充分体现出来的场景和问题,它难以做到准确应对。这意味着,DeepSeek 的能力边界是由它所学习的数据以及训练的场景所决定的。它不像人类那样具备通用的智能,人类可以举一反三,能够灵活地应对各种未知的情况。

大语言模型目前距离通用智能尚有一定距离。然而,它在通用智能的探索之路上,给我们带来了诸多值得期待的可能性以及方向。张奇如此说道。

市场机会显著

接下来的一年有希望成为 AI 应用爆发的一个黄金时期。快思慢想研究院的院长,也就是原商汤智能产业研究院的创始院长田丰,向《瞭望东方周刊》进行了告知。

普通人来看,更形象的比喻是 2024 年的大模型像文科生。2025 年的大模型像理科生,且具备博士逻辑推理水平。它在思路过程中展示出的逻辑能力很接近教授水平或数学家水平。所以从这点来看,在推理能力方面,中国的大模型每半年甚至每个季度都在快速提升。田丰分析称。

这股 DeepSeek 热潮成功地进行了一次市场教育。它使社会大众认识到 AI 的核心易用性和巨大价值,也让 C 端的个人和企业使用者有了直观的感受。同时,还让相关政策制定者对此有了清晰的认识。这股热潮让从业者和大模型厂商看到,在成本可控、算力有限的情况下,也能够训练出高性能模型,这是一种可能性。罗兰贝格的全球合伙人李冰博士同时也是大中华区副总裁,他向《瞭望东方周刊》进行了告知。

图片

2025 年 2 月 24 日,湖北省襄阳市老年大学的授课教师在电脑课上。他们为学员讲解怎样去使用 DeepSeek 人工智能应用。

从企业与企业之间商务模式的角度来看,AI 在制造业等领域都拥有广阔的市场机会,然而目前仍处于市场初期。例如在制造业里,质检属于典型的 AI 机器视觉发力的领域。不过,相对来说,目前 AI 更大的市场在 ToC(企业对消费者的商务模式)。李冰解释道,除了 Agent 之外,智能硬件会有新的且显著的市场机会,像 AI 眼镜、AI 耳机、AI 手机、AI 电脑、AI 家居等,这些都值得期待。

田丰持有相同观点,他认为基础模型的价格战或许会暂告一段落。在 AI 应用领域,我们有希望在 2025 年看到爆款应用开始涌现。除了传统软件的 AI 化之外,硬件 AI 应用也会十分丰富多彩。例如 AI 家居,它不但能够提供传统冰箱的制冷保鲜功能以及空调的环境舒适功能,还能够关注你的健康状况。这意味着家电产业在向服务业进行延伸。原本家电产业的服务或许包含安装维保等内容,然而现在的服务是冰箱会为你安排健康菜谱。

对于服务业来说,如今很多服务业的任务场景都能够借助“传统互联网+传统服务业+大模型”来完成。比如,以往的定制旅游服务,如今通过大模型能够做得更为出色,大模型能够理解客户的复杂需求,并且借助海量信息,更加精准地满足客户对于成本和体验的需求。

中短期内,我们必定会朝着“更高性价比”或者“更便宜”的大模型方向去发展。因为如今我们能够运用高质量训练的大集群以及大规模数据,而数据红利已经接近尾声。所以仅仅依靠预训练解决方案,也就是预训练技术路径或许还会继续前行。然而,性能的提升将会逐渐变慢。

未来,全球对于 AI 人才的抢夺或许会更为激烈。人才被视为科技企业的首要资产。田丰表示,以往外界一般都认为,那些成绩最为顶尖并且有志向在理工科领域发展的中国青少年,其标准的发展路径是先在中科大、清华北大等高校读完本科,接着前往美国伯克利、麻省理工、斯坦福等大学攻读硕士和博士学位,之后再到微软或谷歌之类的跨国大企业工作几年。现在我们看到,浙大毕业的本土博士创造出了非常好的成绩,清华毕业的本土博士也创造出了非常好的成绩,甚至在读的硕士研究生也创造出了非常好的成绩。这代表我们的大学,尤其是 AI 硕博士的教育水平已经提高。这得益于国内教育体系的不断创新,也得益于领军科学家的栽培。

这批 AI 研发创新团队非常火爆,他们的年龄处于 24 岁到 35 岁之间。青年科学家展现出了极大的原始创新能力和潜能。田丰提出建议,下一阶段需给青年科学家更多的科研自由度以及资金支持,要用更高的科研预算、更开放的学术态度和更好的人才保护政策来鼓励创新。

田丰建议,在中国探寻并构建一些能够长期对人工智能核心软件基础研发以及芯片基础研发提供支持的金融体系和机制,以此来帮助创新创业者在 5 年或者 10 年的时间内获得在国际上处于绝对领先地位的原创成果。

本文于 2025 年第 6 期《瞭望东方周刊》刊载,该期为总第 929 期。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275046.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息