2025 年,AI 技术出现了爆发式的增长。DeepSeek 凭借着“3%成本对标国际顶尖水平”这一具有突破性的优势,快速地成为了行业的焦点。当面对 DeepSeek 的迅猛发展时,企业是否真的能够做到“接入即起飞”呢?哪些行业是最适合接入 DeepSeek 的呢?又该如何去评估其商业落地的实际效果呢?
钛媒体的企业数字化 IP《数字价值观察室》在 2025 年进行了全新升级。它围绕着 AI 的落地场景展开深度的解析。并且通过数据驱动的这种方法,真实地还原了 AI 在产业中的应用表现。
钛媒体集团联合创始人&联席 CEO 刘湘明在《数字价值观察室·AI 落地场景观察》首期直播中,与 RollingAI 合伙人刘开进行对话,探讨 DeepSeek 商业落地的场景适用性。
RollingAI 是一家 AI 咨询公司。自 2022 年起,它便只将精力集中于生成式 AI 相关项目。据刘开所述,到目前为止,Rolling AI 已在中国使超过 100 个企业的生成式 AI 项目落地,并且上线了超过 1000 个 AI agent(数字员工)。
春节期间 DeepSeek 爆火之后,RollingAI 为了满足大量客户的需求,依据大量真实的商业场景,对 DeepSeek 的场景适用性进行了评估,并且产出了一份专业且系统的商业落地指南。
刘开在直播中指出,对于 DeepSeek 是否适用于所有行业这个问题,脑力劳动密度较高的行业更适合接入 DeepSeek。比如医疗、金融、教育等领域就属于这类情况。然而,对于需要高互动、即时反馈的场景,像电商客服、游戏陪聊、短视频营销等,DeepSeek 的能力可能并不突出。他建议企业在决定接入之前,要先把自己的业务需求弄清楚。
刘开认为,企业接入 AI 时,技术适配方面之外,技术门槛相对较低。真正的挑战在于业务壁垒,比如企业内部的知识要让 AI 能够理解,业务流程要与 AI 相结合,还有数据安全以及行业监管方面的问题该如何应对等。
谈及 AI 的商业化落地情况时,他指出,在医疗、金融这类强监管的行业中,AI 的商业化落地还需要 6 到 12 个月的适应时间,并且要完成数据合规、系统集成等诸多准备工作。与此同时,面对 AI 的发展,刘开觉得,像 DeepSeek 这样的大模型更像是“劳动者”,而不是传统的软件工具,企业必须让管理层到一线员工都参与其中,才能够真正让 AI 发挥出其价值。
未来,AI 对企业发展会有怎样的影响呢?刘湘明称,DeepSeek 的出现仅仅是 AI 企业应用的开端,就如同马拉松比赛枪响后,大家刚跑出一公里,此时有一个人跑得比较快,但后面的路还很漫长。
附上本期直播时间轴,帮你快速跳转感兴趣的部分
02:41 DeepSeek的行业适用性
07:33 DeepSeek十大典型应用场景解析
09:42 DeepSeek R1与主流大模型对比
15:56 AI智能体的落地预期
21:33 DeepSeek的局限性与挑战
31:40 AI落地面临的技术门槛与业务门槛
37:28 企业转型在AI时代与数字化时代的异同
50:43 企业自评最适合DeepSeek的应用场景
以下是直播实录,经钛媒体 APP 编辑:脑力劳动密度高的行业接入 DeepSeek 更为合适。 脑力劳动密度高的行业适合接入 DeepSeek。 脑力劳动密度高的行业接入 DeepSeek 更具优势。 脑力劳动密度高的行业接入 DeepSeek 更适宜。
刘湘明表示欢迎来到《数字价值观察室·AI 落地场景观察》。今年春节期间,DeepSeek 成为了行业关注的焦点。在短短一个月的时间里,其全球下载量超过了 1600 万,并且成为了史上最快突破 3000 万日活的应用程序。
很多企业家都很关注能否借助 DeepSeek 快速实现企业的智能化。今天,我们邀请到了 RollingAI 的合伙人刘开先生,共同来探讨 DeepSeek 商业落地的场景适用性这一问题。
千行百业都在与 DeepSeek 进行接入。哪些行业最为适合接入 DeepSeek 呢?哪些行业在应用过程中会遭遇一些挑战呢?
从前年至去年,在我们接触的做生成式 AI 大模型项目的这些企业中,脑力劳动密度较高的一些行业更适宜 DeepSeek 这样的模型。典型的场景包含医疗、健康、教育以及金融服务等,这些场景需要把事情想得较为透彻,且逻辑性较强。
一些偏商业营销的场景相对而言,对 DeepSeek 的需求没那么大。像游戏场景、陪聊场景以及一些零售场景就是如此。这些场景更需要快问快答的能力,而 DeepSeek 的专业能力在这些场景中就不那么突出了。
刘湘明说:有许多人对他手上这份 DeepSeek 商业落地指南的报告很关心。他们为什么要进行这样的落地场景评测呢?
刘开称,我们的视角从某种程度上来说属于商业视角。我们不会去和大模型跑分进行比较,也不会去和从科技视角来看具有特定能力的大模型作比较。我们所关注的是在过去的两年里,在为 100 多个客户服务的真实场景中,把 DeepSeek 替换进去,它是否真的会变得更强大。
我们的判断依据并非仅以绝对的准确率来定性。因为在很多商业场景中是不存在准确率这一概念的。例如像一个销售的话术建议,是从其灵活性、亲切度、对产品的理解度以及扩展性等多个维度,以专家的方式,综合进行定性和定量的评估。
有些东西在模型跑分方面很重要,然而一旦进入商业场景,用户的实际感受并不高。而有些事情,用户的实际感受特别高,客户能够很快察觉到的事情,在跑分上却不是很明显。我们的视角决定了我们选择一个偏商业化的视角,以真实的用例为基础,在信息脱敏后进行评测。
刘湘明:这个报告选了哪十类场景?
我们选了这十类场景,其原因首先在于这十类场景是我们在过去两年里遇到的频率最为高的场景,并且我们对此进行了一些抽象的总结。
有一些部分,大家会发现我们没将其放进来。例如代码生成,一方面它确实不是我们最擅长的事情;另一方面,代码生成是一个通过专业的计算机科学跑分以及正确性评估就能进行很好评估的领域。
刘湘明询问:你对 DeepSeek 的表现作何看法?与传统的大模型相比,DeepSeek 在哪些方面具有优势?
刘开:我们有一个非常粗略的对比。
第一,DeepSeek V3 不是一个远超现在市场主流大模型的模型,DeepSeek R1 也不是。无论是国内的通义、豆包,还是海外的 GPT、Claude 等,我们都不认为 DeepSeek R1 和 DeepSeek V3 远远超过了它们。
第二,我们觉得主流的大模型或许都比 DeepSeek V3 稍强一些。在商业应用范畴内,DeepSeek V3 实际上是要比市场上领先的文字大模型或者多模态的大模型稍微弱一点,当然它还比较年轻。
第三,DeepSeek R1 是独特的。它是一个进行深度思考的模型。在一些需要深度思考的场景中,它的表现比市场领先的模型要好很多,远远超出后者。但是我们发现 DeepSeek R1 受自身推理速度、性能、效率、价格等各方面因素的限制。在真实的商业场景中,并非每一件事情都需要深度思考。所以,DeepSeek R1 在一些特定领域会有非常好的表现,然而在这些特定领域,它又需要被其他能力或其他模型包裹起来一起使用。
我们内部有这样一个形象的比喻:有的员工能够快语快答,有的员工执行力较为突出。而 DeepSeek 就像是这样一个员工,每当你交给他任务时,他会说“老板你等等,我现在先不说,让我回去想想”,之后到了晚上,他就能交出一份特别出色的工作。
刘湘明认为这个比喻很不错,报告中提到 DeepSeek R1 在数据分析、文档分类、策略生成等场景表现极为优异,他想知道这些场景的成功应用会给行业带来哪些具体的升级机会。
刘开发现,一些原本不敢想象的事情能够在这些场景中进行。例如,过去利用通用大模型进行深入理解和制定方案时,需借助各种提示工程的知识库来对其进行限制,甚至还得运用较为复杂的逻辑让其先生成,接着再用另一个智能体去检查其逻辑相关性和严密性等问题。而如今,DeepSeek 展现出了极为强大的逻辑能力。
这张图横向观察,其中列出了 8 个行业,这些行业是最常被生成式 AI 或者大模型改造的。颜色越深,就意味着效果提升越高。
在医药健康行业,过去我们做了许多中医专家、营养学专家等领域的知识专家,时常会忧虑它给出的内容以及解决方案是否前后矛盾,亦或是是否完备。如今,我们察觉到 DeepSeek R1 在这方面的能力极为突出,着实令人安心。
在金融业有另一个案例,从一些企业级的金融服务方面,像行业研究以及行业报告等,从对投资标的的研究开始,到个人服务领域,例如能够生成个人服务计划书、保险计划书、理财方案,还能进行动态理财方案调整等。DeepSeek R1 在此都展现出极为强大的能力。我们有时心里会想,一些处于中等水平以及低于中等水平的财务咨询师或者理财师,或许会遭遇一些职业方面的风险。
DeepSeek商业落地的壁垒
刘湘明询问:你觉得 DeepSeek 真正的深度应用何时能够实现商业化呢?AI 医生以及 AI 理财师的出现还需要多久呢?
刘开称:市场往往会高估一项技术在近期的表现。同时,市场也会低估该项技术在远期所产生的影响。
DeepSeek 虽有很好的逻辑,但它对一家保险公司的产品数量、每个产品的卖点、核心用户以及限制范围等方面仍不够了解,这些都需要被灌入进去。
这些行业通常属于强监管行业,比如金融行业需要强监管,保险行业需要强监管,医疗健康行业也需要强监管。之所以要进行强监管,是因为不希望未经训练的人进行操作或给出错误建议,以免造成人和财产的大量损失。监管层面若要应对这些情况,就需要调整其规则和规范。医院需要做对应的开发和备案,医疗公司也需要,药企同样需要,金融公司也不例外。这个过程可能需要 6 到 12 个月这么长的时间。或许要到今年年底,又或许要到明年,才会有极为优秀的 AI 医生来提供服务,也才会有非常优秀的 AI 药剂师来提供服务,还会有优秀的 AI 理财经理来提供服务。
刘湘明说报告提到 DeepSeek R1 在结构化文本输出以及角色扮演场景中,其表现未达预期,在一些方面不如市场上领先的一些大模型。这种差距体现了 DeepSeek 在哪些方面存在局限性?
刘开称,就如同一个极为擅长思考的员工。当你要求他以特定的某种八股文格式来输出信息时,他在晚上交上的作业极为优秀。并且他还会告知老板,自己把老板的格式改了,因为老板的格式不合理。这是可以理解的,而且在某些场景下,我们会对这些事情表示赞赏或称赞。
但是今天我们所有大模型的输出,都需要与许多业务系统进行对接。在与这些业务系统对接的过程中,我们有一些非常明确且不能改变的格式、指令、用名以及参数等。在这种情况下,它如果进行过多的思考和发挥,就会致使系统崩溃。
刘湘明提出,在未来的使用过程中,要怎样去平衡 DeepSeek 的优势与问题呢?
刘开:我们把所有的场景总的来说分成三部分。
在内容输出场景方面,我们觉得当前的主流大模型要比 DeepSeek 更出色,无论是 DeepSeek V3 还是 DeepSeek R1 都如此。我们提议,倘若已经有团队、企业或者场景在实施这些项目,那就继续使用这个模型就行。你们可以对刚开始实施的团队做对比实验,我们也能帮助大家做对比实验,我认为这部分不要去改动。
第二部分,在一些能力均衡的场景中,例如文档分类和打标签。DeepSeek 在某些项目上的准确率明显更高。它虽然更聪明,但速度却更慢,这带来了一些后果,比如在话术推荐场景中,一分钟之后就需要马上改变策略,而 DeepSeek 很难满足这种需求,所以需要进行平衡。
我们发现,在一些其他项目上,DeepSeek R1 与主流大模型的表现较为接近。原因在于,我们企业设计的标签体系可能存在一些问题,比如存在不合理、重叠以及疏漏的情况。由于标签的定义本身就较为模糊,所以无论是对 DeepSeek R1 还是主流模型来说,都存在回答不准确的可能性,因此它们的表现会很接近。
大家要仔细辨别,私有化部署 DeepSeek R1 价格是比较高的。 私有化部署 DeepSeek R1 的成本较为昂贵。 私有化部署 DeepSeek R1 需花费较高费用。
在做策略、方案等深度理解的场景中,DeepSeek R1 的效果更为出色。然而,我们在进行考量时,依然要考虑到时间、实时性以及价格或成本等方面的因素。因此,我们可以通过各种方式,将主流大模型与 DeepSeek R1 进行融合。
我们近期合作的一家 ToB 企业需给客户提供多样解决方案,我们现有的解决方案如下:用 DeepSeek R1 针对其 100 种不同客户场景需求,生成 100 种方案模板;接着用市场领先的优秀大模型,对该模板进行更个性化调整。打个比方,就如同让 DeepSeek R1 去完成作业,而让主流的大模型去抄袭作业,主流大模型抄袭的速度快,质量好,成本还低。
这是一种融合的模式,并且还会有更多融合的模式。例如,有的将策略规划的部分交给 DeepSeek R1 去做,接着把执行的以及补充的部分,像提纲之类的,还有认识文字的事情交给主流大模型去做。
刘湘明称,在这几个月里大家一直在使用 DeepSeek R1,其中“惊艳”是一个较为突出的方面,而“慢”则是另一个值得关注的方面。他询问大家,对于“慢”这个问题,是否能够通过提升算力来解决,亦或是这本身就是 DeepSeek R1 的一个特性呢?
刘开表示,首先,我们当下所经历的“慢”,其主要原因在于投入到 DeepSeek 上的资源不足。倘若不同的云厂商能够投入足够的资源,那么大家所体验到的情况就会变得良好。
其次,它生成文字的速度可能比主流模型慢一些。这是由于它的思考更有深度,其底层的思考链更为复杂。这个思考过程是它强大的所在,但也是它不可避免会有时间消耗的地方。在这方面,我们只能期望 DeepSeek 团队或者所有大模型团队,逐步提升整个推理逻辑,或者提升整个推理效率,然而这个提升的速度会较为缓慢。
刘湘明说:有很多人特别希望能够迅速搭上 DeepSeek 的快车,想要尽快地进行部署和落地。那么在 DeepSeek 的落地和部署过程中,你觉得技术的门槛和业务的门槛,哪一个是更难跨越的呢?
刘开称:技术方面的门槛我们面临得较少。因为如今已经有一些非常不错的企业,其中包括云厂商,在提供类似的服务。然而,作为一个大企业,若要拥有一套自己私有化部署的 DeepSeek,从购买卡片,到组建整个计算集群,再到处理好所有的网关安全问题,最后让 DeepSeek 运行起来,实际上并非那么容易,大家对其的想象过于简单了。
业务存在着很多瓶颈和壁垒。许多企业表示,倘若部署了 DeepSeek,能否将企业的全部知识交给它,然后让它有问必答。这是远期的发展愿景,但在近期的发展过程中,有许多事情需要去准备。例如,一家企业的知识可能存在重复和冲突的情况,某些规章管理制度,A 事业部和 B 事业部的要求各不相同,那么该如何处理呢?企业在日常工作中逐渐积累了很多术语,那么该如何将其整理好,以跨越这种知识壁垒呢?
要跨越知识壁垒,同时也要跨越业务集成的壁垒。DeepSeek 生成的文案需接入媒体管理系统和 CMS 系统(内容管理系统),其生成的业务销售跟进策略要进入 CRM(客户关系管理系统),生成的 OKR 要进入人事系统,并且要与这些系统实现打通,然而 DeepSeek 并不负责管理这一事宜。传统的系统要集成起来并不容易,企业的业务中台要集成起来也并不容易,知识中台要集成起来同样并不容易。
最后,若这些都已处理妥当,我们或许会发现,当企业在进行一个场景的操作时,其最佳的业务服务流程并未被总结出来。无论是业务方案的生成,还是保险计划书的生成,亦或是新媒体小红书以及短视频剧本的生成,都需要具备这些行业的知识与技能(know how)。而这些行业的 know how 必须从这些行业、企业最顶尖的专业人才的头脑中提取出来,并放入 AI 中。这便是今天落地 DeepSeek 的另一个业务壁垒。
刘湘明提出,真正从无到有地落地一个大模型,无论是 DeepSeek 还是其他的大模型,企业需要去做的事情,与原先进行信息化、数字化的流程相比,有哪些不同之处呢?
刘开称,与企业开展信息化工作时,数字化会较为接近。然而,就当下企业需要做的事情而言,从本质上来说有这样两句话:一是要从上至下地确定策略,二是要从下至上地培育文化。
定策略从上至下包含诸多方面。我们会建议所有企业,将自身的数字化团队、业务团队、管钱团队以及管理团队召集到一起。在企业的各种场景里,找出一两个机会,着手开展第一个项目或者实现第一个落地。通过做一些务实且确定性高的场景,若能做成,就能提升所有团队的成就感,从而能够进一步向前推进。这是一个建立信心的过程,也是建立团队的过程。接着一直向前行进,直至实现长期策略。
从下往上开展文化建设。例如,当公司的员工还未使用大模型时,就先让他们使用起来。公司的 IT 部门一定不要禁止这些应用,也一定不要禁止这些端口,要让员工能够使用它们。能够使用就会有亲身感受,有了亲身感受就会产生需求,有了需求就会推动事情进展,进而产生创新。
然后,我们会建议企业的一些核心中层和高层去接受适当的培训。因为大家工作时间都很忙碌,没有很密集地整理过信息。可以让他们上一些提示工程方面的课,上一些 AI Agent 方面的课,上一些 AI 案例商业方面的课。
我们鼓励公司开展创新文化建设,举办诸如创新大赛、效率先锋之类的活动,促使年轻人以及业务一线能够提出需求,并打磨出 Demo 或者 AI 的原型。企业的管理层应给予年轻人和创新者更多的资源、更多的容忍以及更多的保护……当这种文化逐渐成长起来,企业就会逐步实现自我更新。
AI大模型短期内不会让企业数字化系统消失
刘湘明表示,企业在一定程度上都构建了一些与信息相关的系统,也有数字化方面的系统。那么,在未来,大模型与现今的这些系统之间的关系将会是怎样的呢?
刘开认为自己的观点较为激进。他期望将所有的 AI 应用或 AI 智能体更多地视为员工,而非系统;他把其研发过程视为员工的培训,而非系统的研发;他将上线过程视为员工的上岗、评估和下岗,而非系统通过检查清单的测评上线。从这个思路出发,我觉得所有的业务系统在底层会提供其原本具备的能力,而 AI 的能力被附加在其之上。如今,系统已经或多或少地开放了一些接口,供 AI 进行输入和输出。总体而言,我不认为像 SAP 这样的原有管理系统会消失,至少在短期内不会消失。
我的合伙人持有不同观点,他认为这些系统将会消失。我们目前利用 AI 智能体来管理销售线索,而他主要负责商务方面的事务,他的销售线索都存于智能体的脑海中。他现在无需参加周会,也不需要销售 Pipeline 的报表,因为他若有问题就向智能体询问,若有知识就告知智能体。
刘湘明指出还有一个更为现实的问题,许多企业家都较为关心,他们想知道使用 DeepSeek 到底贵不贵,其成本情况又是怎样的呢?
刘开说:要看看是跟谁相比。若说私有化部署 DeepSeek 的话,从现在的情况来看是比较贵的。最近我们刚为一个企业对一个场景进行了评估,这个场景的功能十分单一,仅仅是做一些话术的输出,然而其数量很大,大概一周能有几十万份。经我们评估得出,需要 150 万的硬件投入,并且还要再投入智能开发、软件等方面的费用,我们认为其 ROI(投资回报率)是不划算的。
从云端使用 DeepSeek 或其他主流大模型的 ROI 方面来看,是非常值得投入使用的。例如,我们在为中国最大的租房企业进行智能化改造时,有一个名为智能立单的很小功能。租户给管家打电话称漏水了,管家挂掉电话后,会在系统中花费约五分钟时间填报该记录。以这个管家员工的人力成本计算,这五分钟大概是两块二毛钱。而 AI 读取这段对话,既能把整个单立好,又能使错误率几乎为零,成本可做到三厘钱。虽然每一单节省的成本看似不多,但这家企业一天有好几万单。因此,投入几十万去做一个智能立单的功能,这其实是很划算的。 投入几十万做智能立单功能,其实是划算的。 做一个智能立单功能投入几十万,其实很划算。
我们所看待的是 AI 或者大模型,无论是 DeepSeek 还是其他的大模型。它所提供的并非一个软件功能,而是在提供生产力。它不像一个普通的劳动工具,甚至有点像是劳动者,也有点像是劳动者的助手。我认为这在商业思考层面是一个很大的变化。
刘湘明认为一个很大的问题在于,一代人需要面对知识结构的更新。对于企业而言,非常现实的问题是原有的团队如何进行融合,是否存在很多矛盾?
刘开今天在一个 MBA 的分享课堂上谈到,有位企业家称其企业有众多老专家和老师傅,他们对该业务最为熟悉和了解,他想知道能否将这些人的知识放入智能体中。如今他的业务无法扩展,若把知识放入 AI 中,就能为更多人提供服务,甚至能给东南亚的商户提供服务。我说,从逻辑方面以及技术层面来看都是可行的,不过你得让老专家表示同意。当有一个最为优秀的团队时,我们会察觉到它最为重要的知识并非在文档当中。尤其是对于销售型的企业而言,其最好的销售知识都没有在企业的培训文档里。然而,这些知识都存在于企业内部,通常是由一位老师傅带着徒弟,老销售很厉害,徒弟也会随之变得厉害。
老师傅把知识给出来后,我们需要用知识库、搜索引擎等去承载和优化它。这些事情确实是我们遇到的极大障碍。
刘湘明询问:在能保证 DeepSeek 技术优势的情况下,怎样与不同行业的业务需求相契合呢?又可以从哪些方面入手呢?你能否给出一些建议?
刘开表示,大家能够通过两个问题来进行筛选,找出哪些东西是最适合用 DeepSeek 去做的。
在我的企业中,第一个问题是:哪个部门以及哪个工作的智力密度最高?在智力密度最高的部门里,最耗费时间的事情通常不是决策性的事,而是知识梳理、知识理解和信息整理的事,而这些事情正是 DeepSeek 最擅长的。
第二个问题,若今日在业务方面有 1000 名清华北大的应届生,你会让他们从事何种工作?
这个问题考虑了两个方面:一是智能方面,如今的大模型在许多能力上能接近大学生的智能水平,但它如同大学生,不了解企业内部信息、企业业务、企业知识以及企业“黑话”。若大学生能做的事,或许训练 AI 也能做;若大学生做不了,且需老师傅带着干五年,那就先不让 AI 去做这样的事。
同时,也对企业经济效益进行了考量。如果需要两个实习生来做这件事,那就让两个实习生去做就可以了。然而,如果你需要 1000 个实习生或者 1000 个清华北大的毕业生,以往你是请不起这 1000 个清华北大的学生的,而今天几乎是免费的。
大家可以用这两个问题来反思,在企业内部,哪个场景是最适合用大模型来实现的。
刘湘明表示感谢刘总进行了一场极为务实的分享。我们坚信 DeepSeek 的出现仅仅是 AI 在企业应用领域的一个开端,就如同马拉松比赛枪响过后,大家或许才刚刚跑出一公里,此时先跑出了一个跑得较快的人。未来的道路还很漫长,我们也将持续予以关注并进行探索。谢谢!
《数字价值观察室·AI 落地场景观察》首期直播有部分内容如上,若要观看完整版,需观看《“接入 DeepSeek”就能原地起飞么?——探究 DeepSeek 商业落地的场景适用性问题》。
如果你想要获取完整版报告,那么可以点击链接《DeepSeek 商业落地指南系列 I——场景适用性评估》来进行查看。
(本文首发于钛媒体App,作者|唐刚,编辑|华楠、盖虹达)
关注钛媒体微信号(ID:taimeiti),可获取更多精彩内容;下载钛媒体 App ,也能获取更多精彩内容。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274770.html