1. 首页>>分享

AI智能体技术飞速进步与实际应用脱节:探索数万亿美元市场潜力

大概在 18 个月前,有人向我们演示了“AI 智能体”项目。这个项目的巨大潜力是显而易见的。如今,我们对这个领域的整体情况有了更清晰的认识。

简而言之:AI 智能体正把劳动力转变为软件,这是一个价值达数万亿美元的市场。从我们首次撰写相关文章开始,我们就已经与该领域的许多杰出公司进行了合作,并且希望能进一步深入合作。

如果你密切关注这个领域,那么可能已经发现一个问题,即技术进步与实际应用之间存在脱节。

一方面,技术在飞速地向前发展。近期,有“工具使用”方面的情况出现,像 Operator、CU、Gemini 2.0 等;同时也有改进的“推理”方面的情况,如 O3、R1、3.7 Sonnet 等。这些都是 AI“智能体”的基础前提,并且会把我们推向更接近未来的世界。在这个世界中,AI 智能体能够以远低于几个月前所预期的成本自行行动,并且能够执行复杂任务。新的能力以及 AI 性能和成本的持续优化(比如 Deepseek 及相关的进展),正在为未来即将爆发的需求打下基础。这是一个令人欣喜的消息。

不太好的消息是,技术进步和实际应用之间存在着断层。在工作场景中部署 AI 的意愿与实际落地之间有一道鸿沟。例如,麦肯锡近期对 100 家年收入超过 5000 万美元的机构进行了调查,调查显示,63%的领导者认为部署 AI 是急需解决的事情,但 91%的受访者表示自己还没有做好准备。

一切处于早期阶段。这便是你的机会所在,你的核心任务是搭建技术突破与大规模应用之间的桥梁。你要让人们切实看到变革,让人们渴望变革,还要让变革为他们所用。

要走到这一步是怎样的呢?事实表明,我们或许把 AI 智能体技术栈的一些关键层给遗漏了。

目前,我们缺失了三个必要的层级,外加一个“加分项”:

责任层:透明性、可验证的工作以及推理能力的基础。

上下文层:解锁企业知识、文化与目标的系统。

协作层:让智能体能通过共享知识系统无缝协作。

在兴起的 B2A 领域,赋能 AI 智能体,为其提供工具和软件,以实现自主性的最大化。

我们关注建设这些层级的公司。我们也关注像 Maisa(下文详述)那样整合各个层级的公司。

这些挑战得到解决后,基础设施也完善了,我们就能够用 AI 去处理更复杂的任务,并且这些任务更有价值。当这成为一种常态时,许多现在难以想象的新市场就会开始出现。

但首先,我们需要这些层的存在——原因如下:

解锁自主性:RPA 是机器人流程自动化,APA 是智能流程自动化。

要理解实现完全自主性的方式,首先要看到人们在“流程自动化”方面的认知发生了重大转变。

我们正在从机器人流程自动化这一领域迈向智能流程自动化这一领域。 我们正从机器人流程自动化的范畴迈向智能流程自动化的范畴。 我们正从机器人流程自动化的层面迈向智能流程自动化的层面。 我们正从机器人流程自动化的阶段迈向智能流程自动化的阶段。 我们正从机器人流程自动化的领域向智能流程自动化的领域迈进。 我们正从机器人流程自动化的范围迈向智能流程自动化的范围。 我们正从机器人流程自动化的领域范畴迈向智能流程自动化的领域范畴。 我们正从机器人流程自动化的阶段层面迈向智能流程自动化的阶段层面。

RPA 是一个价值达数十亿美元的产业,其中包含 UiPath、BluePrism、Workfusion 等巨头企业。这表明人们很乐意为高价值任务的自动化支付费用。若要理解怎样开启智能体经济,不妨将 RPA 作为开端。当看清它的优势与局限后,就能明白智能体为何是必然要迈出的下一步。

RPA 的优势在于:它擅长处理基于规则的任务,并且这些任务跨多个业务系统(数量在 100 到 200 个步骤之间),属于结构化任务。RPA 能够通过规则将企业知识有效固化下来,比如增值税号的处理等。只要底层系统是静态的,自动化就能可靠地运行。

此外,RPA已具备强大的产品市场契合。

RPA 存在局限。它可被自动化的任务范围是受限的。因为要详尽规划 RPA 的每一步流程,像点击此处鼠标、按特定方式设计表格等。并且必须保证流程永不变化,不然系统就会崩溃。

RPA 的边界是:无法为所有操作构建出完美且可复制的流程映射(有些企业甚至要聘请顾问去“挖掘”自身流程才能进行建模)。实际上,你不一定总是需要这种方式——把工作做得出色的本质,恰恰就在于能够对环境做出反应,吸收变化并进行动态调整。

简言之,RPA 在某些任务上能有出色表现。然而,它完全缺乏灵活性,它是可靠的,但同时也很不灵活。

随着推理能力不断提升,LLM 大幅度地扩展了可进行自动化任务的边界。

_AI智能体要想行得通,关键在这些地方_AI智能体要想行得通,关键在这些地方

1.0:人力——2.0:RPA——3.0:APA

不过,LLM 并非是完美的。它们在重复性步骤方面表现不佳,然而却能够在业务流程的非结构化环节充分发挥自身的作用。这种情况既可以成为优势,也可能会转变为劣势,这取决于你所期望的结果是更富有创造性还是确定性更强。

无论何种情形,LLM 都属于“黑箱”。你没法百分百地确定该系统将会做出何种行为以及为何会如此行事。即便推理路径或者模型所给出的解释,也有可能完全是编造出来的。

企业需要有确定性,不然的话,任何系统都难以得以落实。即使你期望 LLM 能更富有创造性,但是如果不能理解它得出结论的那种逻辑,那么这种“创造”就不会有任何价值。

那我们该怎么办?

RPA 的产品市场契合度较强,系统运作能够清晰地被看见。然而,它的任务范围存在局限性,没有真正的灵活性,也缺乏对上下文的理解能力,并且还需要大量的“前置准备工作”。

大语言模型(LLM)在处理难以用规则表达的非结构化信息方面更为擅长。然而,它们仍然属于“黑箱”。

AI智能体与APA的答案在于:我们需要两者结合。

我们需要 RPA 系统具备可靠性,同时也需要 LLM 具有灵活性以及低成本,这具体体现在可稽核性和上下文层方面。必须将这些特性融入到 AI 智能体的技术栈中。如果想要实现大规模的应用,本领域的开发者就必须攻克这一难题。

_AI智能体要想行得通,关键在这些地方_AI智能体要想行得通,关键在这些地方

实现APA离不开这关键的几层能力

责任层:规模化应用、学习与监督的关键

回想小学的数学课:仅仅写出答案是不能够获得满分的,老师会要求把“解题过程”展示出来——这样做的目的是为了验证你是否真正理解了推导的逻辑。

当前多数 AI 系统(包含看似展示逻辑链的模型)存在致命缺陷。我们不知道 AI 为何会生成特定的行动或思维链,它们只是被“生成”出来的。

我们在与 Maisa 团队合作时,才意识到这个问题的重要性。该公司的联合创始人 David Villalón 和 Manuel Romero 提出了那个比方,这个比方精准地揭示了当前 AI 智能体生态的症结。

企业被迫对 AI 的思考过程盲目信任。Maisa 在早期产品开发时曾遇到这样的客户要求:必须向稽核方证明 AI 系统的每一步操作,尤其要证明决策背后的原因。

此类需求促使诞生了 Maisa 的“工作链”(Chain of Work)这一概念,我们认为这将成为职场 AI 智能体落地的核心要素。

它的核心部分是 Maisa 的知识处理单元(KPU)。这是一个专门的推理引擎,它将 AI 步骤进行了编码,而不是依赖那些容易消逝的“思维链”文本。

KPU 通过把推理和执行分离开来,达成了确定性和可审计的结果。所有的操作都被记录到了显式的“工作链”里,这样就把 LLM 式的创造力和传统软件的可靠性结合在了一起。与传统的 RPA 以及依赖幕后“推测”的前沿实验室方案不一样,KPU 构建了信任。团队能够清晰地追溯 AI 的每一步动机和方法,还可以修正或优化任意一个环节,并且能够确保变更得到一致的部署。

我常跟创始人开玩笑说,最好的 B2B 软件是能够帮人升职的那种。那些能让内部利益相关者嗅到“引入即立功”机会的产品就是如此。如今 AI 所承诺的正是这样的回报,然而也存在着风险,那就是没有人愿意引入一个最终会失效的系统。

构建这种可追溯性能让风险回报比回到有利的区间。AI 自动化对于企业来说肯定是很大的利好,然而重要的是要降低在落地过程中相关的实际风险以及人们所感知到的风险。

Maisa的“工作链”正在实现这一点——且已见成效。

上下文层:优秀员工的关键

优秀的员工标准包含哪些方面呢?不能仅仅依据资历或者经验来评判。而最终能够决定员工是否成功的因素,有个人风格、适应性,还有能够将要做的事情以及如何去做清晰表达出来的能力。

比如:你所雇佣的营销人员会花费时间去理解品牌的调性以及其背后所蕴含的逻辑,而不会机械性地输出那些平庸的文案。

比如:你所雇佣的人力资源专员(HR)知晓自己的职责不仅是编写员工手册,更是在塑造企业文化。

这是 GPT-4 无法成为优秀员工的核心原因:无论你怎样努力,它都无法切实理解你以及你的企业。GPT-4 依照规则行动,然而像人类员工那样能够把握微妙之处、了解背景的能力,机器是不具备的。即便将规则输入到 AI 流程中或者对 GPT 进行定制,你也无法将所有的隐性条件都列举穷尽。

原因如下:

职场隐性知识难以被完整记录。新员工借助观察、凭借直觉、获取反馈以及提出疑问来进行学习。能否获取并将这些“隐性知识”加以融合,是区分优秀员工与普通员工的关键所在。

显性知识散落在非结构化的数据当中。它们并非在数据库里,而是存在于 PDF 指南中,存在于代码里,甚至还存在于公司邮件里。

更不用说理解当前员工的想法了。

此前我们讨论过,智能体相较于 RPA 的一个优势是具有上下文理解能力。它能够提供适应性,并且省去了价格极高的“流程映射”成本。

知识组织是可行的。在受限环境中,它已得到验证。行业标准的检索增强生成(RAG)或嵌入技术是良好的开端,但当面对海量数据或专业知识时,它们仍会崩溃。

Maisa 的解决方案为虚拟上下文窗口(VCW)。其机制与操作系统的分页机制相近,数字员工能够根据需求“加载”和“引导”数据,从而实现无限的记忆且不会产生零冲突,无需进行微调或采用笨拙的索引。更重要的是,VCW 能够作为员工长期的知识储备库。这意味着它可以自然而然地适应新的指令或者数据,无需任何阻碍。

上下文层是 AI 智能体技术栈的核心。客户将其视为让 AI 员工融入企业独特方法与风格的“入职培训”空间。

难点在于:要为企业把这一上下文进行封装,并且把它注入到智能体的基因里面。从入职开始一直到未来,都要实现知识的“调用”以及持续学习。

这一领域的其他探索活动包括:

协调层:管理智能体员工队伍

未来,企业或许需要管理由 AI 智能体组成的员工队伍。客服、销售、HR、财务等这些职能,将会由不同公司所提供的智能体来承担。

这一切已悄然开始。现实中已出现AI智能体的招聘启事:

AI智能体要想行得通,关键在这些地方__AI智能体要想行得通,关键在这些地方

面向AI智能体的招聘启事

这些智能体要与人类进行“对话”,并且它们彼此之间也需要进行交互。它们具备权限管理以及需要受到规则的约束,隐私和安全是它们需要重点考量的方面。

这是 AI 智能体领域的一个关键时刻。从表面来看,智能体集群协作呈现出势不可挡的态势。然而,也有可能出现另外一种情况:企业,特别是那些行业巨头,会试图去垄断智能体的开发与管理体系,会排斥外部的协作,从而形成赢家通吃的局面。

但到现在为止,没有证据能表明 AI 产品会迈向垄断。构建 AI 系统的核心要素,像基础模型等,除了 GPU 之外,并未被少数几家公司所掌控。OpenAI、Claude、Gemini、Mistral、DeepSeek 等这些参与者是共同存在的。

当前智能体领域的初创企业在不断激增。更有可能的是,那些深入钻研此领域的团队,会比那些大型企业更快地解决通信与权限方面的难题,而不是被大型企业封杀。

繁荣的智能体生态最终会达成多方共赢的局面。客户能够无限制地筛选 AI 人才,进而挑选出最优的方案。而创始人能够凭借网络效应,从连接者的角色里获取利益,每增加一个智能体,生态的价值就会提升一分。

因此,智能体间的通信至关重要。

前沿企业已经采取行动,比如 Maisa 的 KPU 等技术能够实现多模型兼容,从而确保了灵活性。然而,随着基础模型不断地持续进化,我们仍然需要建立起安全的知识交换系统以及共享系统。

在智能体生态全面启动之际,这些问题亟待前瞻性思考。

前沿:为AI智能体配备工具

一旦解决了责任层、上下文层与协调层,真正的乐趣才刚开始。

AI 智能体工具市场开始有了一些迹象——这类软件的目的是提升智能体的工作效能,于是有人将这个新出现的领域称作“B2A”(企业到智能体)。

这是一个关键的突破:智能体会从执行者的角色升级为自主进行决策的角色。想象一下,如果人类被禁止使用计算器或者电脑的时候——当你部署了智能体之后,就必须为它配备能够使其成功的工具。

我们已经看到了一些初步的迹象:GPT 能够调用浏览器,Claude 可以操控光标,ElevenLabs 能够让它们发出声音。然而,未来的能力可能会比现在强大十倍。

智能体需能相互支付服务费用、签订合约,或接入人机交互系统。

应用和基础设施会彼此激励。在 AI 智能体领域也是这样:基础设施层会促使出现新型智能体与工具,并且这些创新会反过来促进基础设施的进化。

打造将智能体当作终端用户的工具,此领域仍为一片蓝海。我们在密切进行关注。

AI智能体要想行得通,关键在这些地方_AI智能体要想行得通,关键在这些地方_

以人类优秀员工作为模板,关注当下 AI 智能体的差距,对未来 AI 智能体的形态进行展望

AI智能体落地的真正挑战

要明确一点,那就是我们全力押注智能体,并且对其潜力充满信心。对于我们以及合作创始人来说,AI 智能体的普及化是一种必然的趋势。

令人兴奋的是能够从零开始构建新的生态。我们需要理解怎样去推动人们接纳一个全新的计算范式,因为这一切是有其生命周期的,而我们目前还处在起点位置。

打造这几个层是关键,这能让 AI 智能体成为大众信任的日常工具。跨越应用鸿沟,正需要攻克这些挑战。

我们为那些勇敢面对挑战的公司而喝彩。这些公司是即将掀起的 AI 智能体革命的基础架构。

译者:boxi。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275073.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息