1. 首页>>分享

员工月均加班超100小时,企业如何通过AI大模型降本增效破解效率瓶颈?

员工月平均加班时长超过 100 小时,部门的负荷已经达到了极限。在如今业务竞争压力急剧上升的情况下,大模型的落地不再仅仅是一种“赶潮流”的行为,而是企业迫切需要 AI 大模型在降低成本、提高效率(例如流程的优化、决策的加速等方面)上突破当前所处的困境。

企业希望利用大模型的数据分析等能力,来破解企业效率方面的瓶颈。比如能够高效整合多维度数据资源,把繁琐且重复性的工作转化为智能化操作;还能精准捕捉市场动态与用户需求,在业务的各个环节实现精细化运营等。这样就能释放人力价值,显著降低运营成本,同时提升服务质量。

当前,有大批企业已经开始进行大模型的落地工作。在这个过程中,既取得了一定的成就,也遭遇了一些问题。在日前举办的 QCon 全球软件开发大会·北京站的“企业 AI 落地中的战略、组织、与人才”闭门会上,来自不同行业的负责人针对大模型落地过程中的成熟场景、踩坑经验以及组织人才等问题展开了深度的探讨。

落地演变

总体来看,传统行业在 AI 应用方面呈现出阶段性的变化。早期的时候,更多的是进行尝试性的探索。近几年,开始转向务实的路线,将注意力聚焦在成熟度较高的技术上,像图像识别、视觉算法、OCR 以及自然语言处理(NLP)等这些技术,在企业内部已经有了广泛的应用。

大模型应用在去年和今年呈现出截然不同的态势。去年,企业推进时可能会遭遇“有资源却求人用”这样的困境,因为大模型的成熟度未达到企业落地的门槛,所以大多是以探索和小规模 Agent 应用为主。今年,国产大模型(像 DeepSeek、通义千问等)的能力提升得很快,这让大家对 AI 的认知得到了普及,目前已经呈现出“需求井喷”的场面,那些有一定技术储备的企业已经逐渐具备了能够快速切换技术方案的能力。

落地要“价值导向”

具体而言,在新兴技术刚开始发展的时候,企业能够对短期的低回报率予以容忍,并且会鼓励进行内部试点以及概念验证(POC)。

在应用落地阶段,核心在于围绕“价值导向”进行判断。与追求技术前沿不同,企业更为看重在短期内能否产生实际效果。对于成熟技术而言,要看在六个月到一年半的时间内能否获得可量化的投资回报。尤其如果在前六个月就能产生效果,会特别受到重视。这类项目在整体中所占比例为 80%。而对于超长周期的项目,则会谨慎推进。

在落地过程中,企业会明确规定用户体验的红线,即禁止把用户当作“小白鼠”。对于所有正式上线的应用,需要严格满足以下这些指标:在业务侧,要能够有提升效率或者数据质量的可量化的验证;在技术侧,要达到 Token 响应速度以及系统稳定性等硬性标准;同时要坚守体验底线,避免让用户感觉到是“人工智障”。

成熟应用场景的三个特征

当前大模型落地中,常见的相对成熟的应用场景如下。这些场景具有三个共性,一是重复性强,二是具备一定创意需求,三是范式可沉淀。这三个共性决定了这些场景最为适合用大模型或 Agent 切入,并且能够尽早产出价值。

知识进行问答。许多企业以聊天机器人的形式引入大模型,有的企业直接将大模型接入其中,有的企业则在大模型的基础上融合内部的知识库,从而构建出更符合企业需求的问答系统,这类场景在大型企业中尤其率先得以落地。

智能客服。大模型能够完全替代传统基于规则的技术来进行智能客服工作,并且效果比之前好了许多,此场景已较为成熟。

物料进行生成。其中涉及到多模态的能力应用,像文生图以及文生视频等。很多电商企业都需要制作数量众多的 SKU 图文内容,如今大多是通过 AI 来完成的,而人力仅仅负责流程管理以及后期的修正。这个场景已经处于相对成熟的状态。

企业的数据分析需求日益多样。小型公司会借助 chat-Excel 这类工具来处理轻量级需求,像 100 个表以内的数据。而企业级用户则主要依赖 Data Agent 类产品。在该场景中,数仓治理、指标治理以及口径规范性是核心内容,倘若缺少这些,就难以对上层应用提供支持。

操作实现了自动化。它可以被视为传统 RPA 的升级版本,能够在其中添加 planning 的能力,朝着行业 Agent 的方向演进。这类 Agent 并非仅仅是简单的流程自动化,而是拥有一定决策能力的智能代理。

代码生成。代码补全是一种较为常见的应用。然而在企业看来,AI 代码贡献率仅为 20% - 30%并不理想,因为开发人员每天实际写代码的时间大概也只有 20% - 30%,多数时间都用于沟通、需求理解等方面。另外,Cursor 等在跨职能协作场景中的应用效果较好,但在核心业务领域中还难以应用。

企业而言,AI 应用并非是进行“替代”,而是将其作为优化日常运营体系的一种方式。从流程实现自动化这一方面,到交互达到智能化这一方面,它们都是企业提升效率进行升级的重要路径。

组织架构

企业若没有 AI 基础,通常需进行架构调整以推动 AI 落地。对于有一定 AI 技术积累的企业,在架构上的调整相对较少。

架构调整模式选择

通常,企业有两种调整模式。一种是成立大规模专职 AI 团队来推动转型;另一种是要求现有业务团队自主去拥抱 AI。然而,直接要求业务使用 AI 会存在一定阻力,可能是因为认知不够而不响应,也可能是在兴趣丧失后就放弃等。后一种方式相对来说都比较难以推行。因此,经过一番摸索之后,有的企业决定成立一个几人规模的 AI 小组。这个小组的重点在于赋能,而不是进行扩张。其职责包括引入 AI 工具,并对业务团队进行培训,同时还会联动业务团队以及业务种子用户,一起进行探索。

一种情况是,企业察觉到当下单兵作战的模式以及小规模的研发,难以跟得上疫情后的技术爆发节奏。于是,企业把过去分散的 AI 团队、大数据团队以及企业架构等赋能型团队整合到了一起,致力于攻克重点技术领域。企业在找到了一些较为成熟的落地场景之后,接着又将各个业务部门分散开来,推动它们进行快速复制。

大部分企业无论做出何种选择,都开始组建专门的 AI 团队以推动企业内部的落地。最终可能会形成“混合型”的架构模式,具体表现为:一方面,有一个精干的小团队处于探索的前沿;另一方面,推动产业团队去接纳 AI。

人才在落地过程中是关键的一环。然而,要招到真正懂得 AI 的人才,尤其是懂得大模型的顶尖人才,其难度是非常大的。

当前,企业 AI 人才有两种方式,分别是外部引用和内部转型。外部顶尖人才的引入是较为常用的方式,企业期望顶尖 AI 人才能够带领团队逐步推进 AI 与大数据的布局。随着业务的“跨界”属性不断增强,企业更倾向于那些兼具 know-how 和技术实践能力的复合型人才。企业会让原来的相关团队逐步向 AI 团队进行转型,其中包括一些自动化团队以及语言团队等。

年轻化招聘导向

招人难是普遍的现实情况。大模型和 AI Agent 等方向的人才本身就极为稀缺。对于非互联网背景的企业而言,要招到这类顶尖人才的难度更大。

很多真正懂技术的人是刚毕业几年的年轻人,且他们来自顶尖高校。所以,一些企业将招募重心放在这类年轻实习生身上,期望他们能够参与前沿项目并逐步成长,最终留到公司。

实习生招聘难度相对较小,然而普遍存在业务理解不足的情况。正因如此,企业会采用“实习生 + 资深业务同学”搭配的模式。在这种模式下,由资深业务同学帮助实习生理解痛点、抽象问题,之后再由实习生进行技术实现。这个过程中遇到了一些问题。实习生时常对 AI 技术表现得过于乐观。即便在存在已有局限性的问题上,他们仍坚持进行尝试。在这种情况下,就需要技术负责人具备相应的判断力,能够适时地止损,以确保资源能够聚焦在真正具有价值的方向上。

专家表示,培养年轻人才的关键包含给予他们信任、给予他们成长空间以及给予他们挑战性课题。如果计算资源存在有限的情况,然而只要课题具有吸引力,就仍然能够激发他们的热情并且让他们投入其中。

此外,企业为了弥补自身内部人才不足的缺陷,会引入乙方专家来进行陪跑。企业会筛选那些案例经验丰富的服务商,然后让这些服务商的专家与企业的项目组一起共同将场景落地。

落地经验 不要盲目追求模型微调

一开始就提出“用自有数据微调开源大模型”,这是最为典型的一个误区。从表面来看,似乎能达到三个好处:能够获得自主知识产权,向上汇报时能有成果展现,也能体现出团队的技术价值。但实际上从技术角度来看,存在着非常严重的问题:微调过程需要高质量的标注数据、充足的算力资源以及较强的工程化能力,然而企业通常会低估数据治理的成本以及模型维护的难度,最终会使得投入和产出之间出现严重的失衡状况。

专家给出的建议是分阶段构建能力。

第一阶段的任务是搭建企业知识治理平台。这一阶段的核心目标在于把分散的业务数据,像文档、数据库以及员工经验等,转化为结构化的知识库。在这个过程中,面临的最大挑战包括清洗非结构化数据,例如合同扫描件和会议纪要等,以及将隐性知识进行显性化,比如对老员工的经验进行萃取。这项工作需要一把手来推动。首先要选择垂直场景进行小步验证,比如客服知识库。同时,要建立数据标注、更新以及权限管理的机制。

第二阶段是构建企业智能体平台。此阶段的重点在于怎样利用大模型对企业内部数量众多的 SOP(标准操作流程)进行重新构建,目的是提升效率,例如能够自动生成巡检报告以及实现智能审批工单等效率提升方面的场景。技术实现方面,短期的主流方案是以 RAG(检索增强生成)来解决知识实时性问题。未来,多模态大模型将会催生新型的 Agent 范式,例如结合图纸识别的工程质检 Agent。今年,在多模态能力的支持下,是否会出现适合企业内部的新型 Agent 范式,这是非常值得关注的。

底座模型的更新迭代速度很快,企业花费几个月时间开发的功能,可能在一个新模型版本上线后就直接被替代了。在这种情况下,AI 负责人很容易在内部承担责任,被质疑是否在浪费资源。最好是让模型按照自己的节奏运行,企业在旁边进行补充性的能力建设,以达到“水涨船高”的效果。

绑定业务深度参与

站在岸上的人永远不会说自己对这个 AI 方案满意了。AI 的“最后一公里”必然是在业务中得以完成的,这需要产品团队、业务团队和 IT 团队等进行深度协作,共同推进试点工作,共同完成场景的闭环。例如,业务方需要承担起场景配置的责任,像进行行业黑话的翻译以及分析范式的定义等。如果不是这样,最后的反馈或许会是:“有一定的用处,然而在 20%的关键场景中无法运行”,这样的局面对于整个项目而言是极为危险的。

成功场景都需要业务一把手的支持,不过要避免过度干预。比如不能强求 100%的准确率,以免导致项目陷入僵局。理想的模式是业务领导给予资源支持,同时不干涉技术决策。

具体落地过程中,专家建议双轨并行的策略推进 AI 落地。

第一条腿为“速赢模式”。要选一个关键场景进行快速试点,促使组织内部的关键人、决策者以及业务方尽快体验到 AI 的益处。这种试点需选择切口小且闭环快的项目,通常建议将时间控制在半年到一年内以看到效果。试点项目不必过多,关键在于邀请到业务中的关键意见领袖(KOL)参与,让他们对 AI 形成预期。

第二条腿是“AI Ready”,意思是要做好企业内部的准备工作。在任何场景下,最终都离不开企业内部私域知识和私域数据的结构化支持。例如在数据分析场景中,企业首先需要把数仓建设好,将指标体系和数据模型梳理清楚,只有这样,data Agent 接入后才能真正运行起来。

AI Agent 落地的核心

如今企业落地中,Agent 是一个绕不过的话题。

2024 年被当作 AI Agent 的爆发起始点。硅谷超过 80%的新创公司在对 Agent 领域进行布局。然而从长期角度来看,“Agent”或许会像“App”那样,不再被特意地着重强调,而是会变成技术应用的底层形态。它的本质是大模型能力的一种延伸,最终会融入到具体的业务当中,而不是仅仅停留在概念的层面上。

Agent 的三大核心能力包括:

任务规划方面:将用户的意图进行分解,然后按照步骤去执行那些较为复杂的操作,比如订外卖或者访问网页。

长距离推理:突破大模型“next token prediction”的局限,在长对话过程中能保持上下文的一致性,并且可以实现持续的需求追踪。

长链条工具调用,即串联多系统工具和 API,以此来完成端到端任务的闭环,这标志着从“生成式 AI”到“代理式 AI”的跨越。

当前,业内对 Agent 在 B 端的应用更为看好。它可以通过聚焦垂直场景,像客服、财务分析等,来替代传统 SaaS。并且能够通过深度集成,实现长链条推理与工具调用。然而,在 C 端,比如通用型 Agent Manus 的形态尚未明确,可能会向写 PPT、数据分析等场景进行扩展,需要用“不设限”的策略来吸引专业消费者。

Agent 落地的核心在于解决高价值的问题,比如周报自动化,以此淘汰低效团队等,而不是仅仅关注技术本身。企业需要算清楚“问题价值与解决成本”之间的经济账,不能过度投入大模型,而应当将精力集中在场景问题上。

未来,Agent 有可能成为类似微信那样的“超级 App”。它会集成多模态入口,比如 AR 设备等。并且能够构建 Multi-Agent 协同系统。在智能城市以及车路协同等领域,或许会诞生“市政超级 Agent”,可以实时地联动基础设施与决策。

结语

企业初期对大模型抱有过高期待,之后走过了这个阶段。现在企业已逐步冷静下来,开始探索大模型的能力边界。在落地时,首先要合理评估模型的能力,并且结合自身业务需求接入应用。大模型应用整体而言还不成熟,不过能够从容应对个别“点状”场景。未来要形成成熟的“网状”应用场景,还需要全行业持续进行探索。

本文来自微信公众号 ,作者:褚杏娟,36氪经授权发布。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275505.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息