1. 首页>>分享

AI Agent:更接近AGI的未来,人与机器互动的新范式转变

更接近 AGI 的形态是什么呢?是那种能够用脑子进行思考的大模型呢,还是那种能够用行动来进行互动的 Agent 呢?

技术不断进步,应用不断落地,人与机器的互动方式正在发生范式转变。这个答案成为了两者的结合,即 AI Agent。

AI Agent 也被称为 AI 智能体,它是一种能够通过感知环境,进行思考决策并执行的智能体。和 GPT 等应用相比,AI Agent 在思考与行动方式方面和人类较为相似,它是人工智能机器人的初级形态。

在过去的三年时间里,大模型在自然语言处理以及图像生成等领域展现出了令人惊叹的能力。然而,当参数规模突破千亿级之后,技术边际效益逐渐递减的魔咒开始展现出来:模型的理解能力仅仅停留在表层语义这一层面,对于复杂任务的执行需要依赖人工对指令进行拆解,在应用落地方面陷入了“玩具化”这样的困境之中。

更重要的是,用户对于 AI 的期待已经不再仅仅局限于简单的问答。他们期望拥有一个能够主动进行思考的助手。这种供需之间的不匹配,为 AI Agent 提供了爆发的契机。AI Agent 如同一个具备感知能力、理解能力以及行动能力的 AI 助手。

图片

大模型应用元年到来之际,技术落地成为备受关注的问题,很多人将 AI Agent 看作这轮 AI 技术落地的最终范式。

去年,市场研究机构 Research and Market 发布的报告表明,在未来五年里,AI 智能体的市场规模将会增长 420 亿美元。同时,麦肯锡也宣称,AI 智能体将会成为生成式 AI 的下一个重要领域。

2025 年到来,OpenAI 的 Operator 开始行动,中国 AI 公司蝴蝶效应研发出了 Manus,同时大厂和独角兽也在竞相加速,一场围绕 AI Agent 的竞逐赛就这样悄然开始了。

这场竞速赛肯定是不容易的。算力成本呈指数级增长,在多轮对话中会出现幻觉误差,场景落地的复杂程度也很高……就像每一场技术风暴来临的时候一样,这些都是行业玩家们所面临的共同难题。

比尔·盖茨曾说,谁能主宰 AI Agent 是一件大事。因为这样你就永远不用去搜索网站或者亚马逊了。

AI Agent 从实验室走向产业前线,它的想象力极为广阔。在技术与现实相互博弈的过程中,能够精准且迅速地落地,为用户提供一个可靠的 AI 助手,这才是这场比赛的关键所在。

AI Agent 从 Operator 到 Manus 为何令人兴奋?

“求一个Manus邀请码”。

上周,科技圈对这个名字是熟悉的。就像 GPT 和 DeepSeek 在模型层非常火爆一样,在应用层也出现了新的火爆点。

这款被称作“全球首款通用型 AI Agent 产品”的,是由中国的 AI 创业公司推出来的。团队介绍说,Manus 是一个切实自主的 AI Agent,它能够去解决各种复杂且多变的任务。

该产品还没有完全向外部开放。内测码非常难以获得,几乎是一码难求。而市场对于 Manus 的好奇程度已经达到了最高的顶点。这其中到底有着怎样的一种魔力呢?

很重要的一点在于,Manus展现出了更“类人”的能力。

图片

图源Manus官网

Manus 在独立的虚拟机里。它能够独自思考,能够进行规划,还能执行复杂任务,并且可以直接交付完整的成果。当接到用户指令后,它能够直接操作电脑,完成报告撰写等一系列工作,也能制作表格等,最后还能导出符合用户需求的产品。

Manus 在筛选简历时,会进行自动解压文件的操作,会进行上传简历的操作,会浏览简历,会记录重要信息,会给出自动排名建议,还能够根据工作经验等重要维度,把候选人分为不同等级。

Manus 展现出了自我思考和自我规划能力,且这种能力更进了一步。普通大模型只是提供想法,而 Manus 不一样,它不仅能提供想法,还能帮助用户将想法转化为现实,以解决实际问题。

这背后,Manus 的核心竞争力在于它具备全链路自主执行的能力,这种能力依托于 Multiple Agent 架构。Manus 凭借“规划 - 执行 - 验证”的多代理协同架构,用户无需进行对话引导,也不必提供建议,只需静静等待 Manus 直接交付完整的任务成果。

一夜之间,Manus好像颠覆了 OpenAI 和 Anthropic 以往的状态。

实际上,市场较早感知到 AI Agent ,这种感知来自于 OpenAI 和 Anthropic 。

今年 1 月,OpenAI 推出了其首款 AI 智能体 Operator。Operator 是以 Computer-Using Agent 模型为基础构建的。它能够依据用户的指令,在云端开展各种任务,像订餐、制定计划以及购物等。

一个月之后,OpenAI推出了面向深度思考领域的智能体 Deep Research。与 Operator AI 助手的定位相比,Deep Research 宛如一个“AI 研究员”。它能够把原本人类需要 8 小时完成的任务缩短至 5 分钟,从而在工作中帮助人们节省数小时甚至几天的时间。

OpenAI 的前研究副总裁达里奥·阿莫迪以及大语言模型 GPT - 3 论文的第一作者汤姆·布朗等人一起创立了企业 Anthropic ,该企业布局 AI Agent 的动作更为提前。去年 10 月,Anthropic 以 Claude 模型为基础,推出了扩展功能 Computer Use。用户可以像指挥人类那样,指导 Claude 去操作电脑,其中包括移动光标、点击按钮以及输入文本。

值得注意的是,Manus的出现让大家想起了 Devin。Devin 是去年由 Cognition AI 推出的全球首个 AI 软件工程师。Devin 是一个自主 Agent,它能自主学习不熟悉的技术,端到端地构建和部署应用程序,自己改 bug,甚至还能训练和微调自己的 AI 模型。

在一个新兴的赛道中,先发所具有的优势固然是重要的。然而,当大家都在努力发力的时候,好用这一特点就会成为一个全新的评判标准。

AI 智能体的工作原理包含四个步骤,分别是感知、信息处理、执行以及输出。在这些步骤中,若要让 AI 智能体真正成为人类的 AI 助手,那么效率和准确度都起着重要的作用,而这也正是 Manus 此轮火爆的原因所在。

Manus 在 GAIA 基准测试中取得了突破性成绩,这是 Manus 官方所介绍的。Manus 解决复杂问题的准确率比 Open AI 的同类产品要高出 12%。

Operator 到 Maunus ,AI Agent 这把火呈现出越烧越旺的态势。从本质上来看,AI Agent 能让市场如此激动,原因在于它促使 AI 实现了从被动响应到主动执行的跨越。当 AI 开始突破认知层面并转向行动层面时,AI 时代或许就真正开始了。

2、大厂、独角兽集体加速,AI Agent今年是爆发元年?

今年,GPT 所掀起的大模型浪潮还没有平息。同时,AI Agent 也迎来了爆发的元年。

前不久,百度的创始人李彦宏提出了一个观点,他认为 2025 年有可能会成为 AI 智能体爆发的元年。推理大模型纷纷涌现出来,展现出了令人惊叹的深度思考能力。这种深度思考能力将会推动人工智能的一个重要应用方向,也就是“AI 智能体”的落地。

整个行业来看,AI Agent 处于风口之上这是大家的共识。市场研究机构 Gartner 把 Agentic AI 列为 2025 年的十大技术趋势之一,还预测到 2028 年至少有 15%的日常工作决策会由 Agentic AI 自主完成。德勤 AI 研究院称,AI 智能体将会改变基础业务模式,达成新的工作、运营和价值交付方式。

AI Agent 与 GPT 等对话式 AI 有所不同,它能够像人类助手那样独立地规划任务,还能调用工具并交付成果。可以这样理解,大模型让 AI 拥有了“脑”,而 AI Agent 则让 AI 长出了“手和脚”。

AI 领域的竞争在悄然间已经转向了更具想象力的战场,那就是 AI Agent。在国内的这场竞速赛里,科技大厂和 AI 独角兽依然是两大主要的角色。

大厂们的思路是,借助 AI 智能体来赋予业务以力量,将 AI 应用生态予以完善,进而提升业务以及自身在 AI 时代所具备的竞争力。

百度在 AI 领域表现强势,其动作最为繁多。尤其是从去年开始,百度多次对外公布 AI 的进展情况,“智能体”是经常被提及的关键词。百度已经把智能体运用到移动生态的各个不同场景中,像百度新搜索、百度文库、百度电商、文小言等这些产品都有应用。

其中,文心智能体具有代表性。目前,它已经吸引了 15 万家企业以及 80 万名开发者参与其中。据百度方面透露,文心智能体给百度搜索带来了多轮对话这一能力,还带来了超级外脑这一能力,同时带来了创意升级这一能力,也带来了拟人体验这一能力,并且带来了多元推荐这一能力。

一方面,阿里近期把 AI 智能体的重点置于 To C 领域。在发布并开源推理模型通义千问 QwQ - 32B 之后不久,阿里将其融入到通义 APP 中。3 月 10 日,阿里的通义 App 进行了全新升级,并且上线了超级智能体。通义 App 以超级智能体作为交互中枢。用户在通义首页可以进行询问和聊天。通义超级智能体不仅能够理解图片,还能够生成图片,同时具备翻译、写作等复杂功能。

腾讯也同样聚焦 C 端。在今年 1 月的腾讯 2024 员工大会上,腾讯创始人马化腾表明,腾讯会不断投入资源来储备算力,期望各个事业部都能接纳大模型的产品化落地场景。其中,微信、QQ、输入法、浏览器等产品将会推出 AI 智能体,游戏、微信读书、腾讯视频等产品也会以混元为基础进行更多的 AI 探索。

相比于 BAT 结合自身进行深度思考并推出大模型而形成的智能体,字节跳动的智能体呈现出一种更像是追赶着 OpenAI 的态势。在 Operator 发布的前两天,字节跳动的豆包大模型团队就已经将同类型的智能体 UI-TARS 公布了出来,这个智能体的功能与 Operator 大致相近。识别过程是通过视觉模型和推理来实现的。它能够自动地一步一步完成跨应用的复杂操作,并且还兼容各种系统。

大厂凭借算力和数据等方面的优势,基本上是在模型端、应用端以及智能体开发平台协同这三个领域进行闭环发展。

在一站式智能体开发平台领域,字节跳动的扣子已经上线了,腾讯云的腾讯元器也已上线,百度智能云的千帆 AgentBuilder 已上线,阿里云的大模型平台百炼同样已上线。

在 AI 独角兽里,智谱是最先对 Agent 进行探索的初创企业。去年 10 月,它推出了自主智能体 AutoGLM;在一个月后的 Agent OpenDay 上,智谱展示了 AI Agent 的最新成果,其中有 AutoGLM、AutoGLM - Web、GLM - PC 这三个版本,分别对应手机、浏览器、电脑的应用场景。

图片

据悉,新升级的 AutoGLM 具备理解超长指令的能力,也能够执行超长任务。在多步以及循环任务当中,AutoGLM 的速度表现比人手动操作还要快。今年 1 月,Agent GLM - PC 1.1 的正式版正式上线,其操作速度提升了,任务成功率也提升了。

需要注意的是,2023 年经历了百模大战,2024 年出现了应用之争,行业淘汰赛在加剧。对于初创企业来说,2025 年落地路线的选择至关重要。

2 月 21 日,阶跃星辰宣布开始在智能终端 Agent 方向发力。阶跃星辰与吉利汽车集团、OPPO、智元机器人等企业进一步加深了合作关系,尤其是在智能终端 Agent 的开发方面。同时,还向外界展示了在金融财经、内容创作、新零售、数字人等领域的创新成果以及这些创新成果的应用情况。

去年 5 月,Kimi 在月之暗面上线了 Kimi + 智能体商店。该商店旗下有 20 多个智能体,这些智能体是由官方提供的。

AI 初创企业相较于互联网大厂,其布局智能体的思路是,把自身的模型能力与智能体相结合,从而推出更多能够在具体场景中应用的落地方案,并且去寻找商业变现的路径。

技术不断发展且市场逐渐成熟,AI Agent 领域的竞争会越发激烈,各企业的产品会持续迭代升级,从而满足用户日益增长的需求。

3、想象力大,落地却不易

Manus 突然变得火爆,这使得 Manus 的团队没有预料到市场会有如此高的热情。

Manus AI 团队的产品负责人张涛近日在朋友圈发文。他说,这原本是在产品探索过程中的一个阶段性收获分享。所以,服务器资源是按照 demo 的水平来准备的,他未曾想到会引发巨大的波澜。

Manus 爆火之后,出现了关于 Manus 通用型的诸多质疑声,如“套壳”嫌疑以及官网卡顿等。“套壳”的意思是 Manus 自身没有自研底层大模型的能力,它的模型能力主要来源于 Anthropic 的 Claude。

Manus 团队声明,当前的 Manus 距离正式版且交付给大家的体验还很遥远。模型幻觉方面还有很大提升空间,交付物的友好度方面也还有很大提升空间,运行速度方面同样还有很大提升空间。

事实上,Manus的困境是当下AI Agent赛道的缩影。

首先是 AI 幻觉问题。OpenAI 的 Operator 可能会因为数据污染而生成错误的结论;Manus 在演示时虽然表现得很流畅,但在实际应用中,常常由于系统权限的限制,无法完成订餐、支付等任务。

目前的 AI 技术难以避免所谓的幻觉问题。DeepSeek-R1 的幻觉率达到了 14.3%,GPT-4.5 的幻觉率是 7.1%。在某种程度上,AI 的幻觉能力和其推理能力存在正相关关系。这意味着,越聪明的 AI 越有可能具有更强的幻觉能力。

这对 AI 代理无疑是个棘手的问题。AI 助手的作用是提高效率,而用户的最终需求就是准确性。幻觉问题可能会让用户经历包括检查、复查等多个环节,必然会成为 AI 代理爆发的主要阻碍。

在金融领域,任何误差都可能引发严重后果;在医疗领域,任何误差都可能带来巨大风险;在法律领域,任何误差都可能导致重大影响。这些都是高风险领域,在这些领域中,任何误差都可能引发类似暴风雨般的后果,这也就限制了 AI Agent 的场景落地。

更重要的是,AI Agent 与对话式的 GPT 相比,有一个重要进步,那就是“有记忆”。Manus 通用型 Agent 具备“记忆能力”,如果用户之前要求“用表格呈现结果”,那么在下次任务中它会主动生成 Excel 文件。一旦出现幻觉问题,AI Agent 作为工具的实用性就会受到质疑。

本质上,幻觉问题的产生是因为数据的缺乏。人类在社会发展过程中,通过理论和实践不断学习并进化。AI 也需要源源不断的数据反馈才能进化,并且数据的训练离不开实际的应用落地。

目前在实际应用方面,C 端智能体大多将自身定位为智能助手。它能够读取语音指令,以此来理解用户的意图。并且还能模拟人类行为,完成诸如订机票、点外卖、筛简历等基础的日常需求和工作。

这时候,用户留存以及心智培养成为一个问题。像 Manus 这样以主打通用为特点的 Agent,或许在垂直场景中难以发挥其作用。而人类社会是由一个个具体的场景所构成的,其复杂程度是难以想象的,通用型 Agent 最终在用户生活实际中能起到多大的作用,仍然是未知的。

一方面,B 端智能体需提供更专业且定制化的服务。在 B 端的场景之中,Agent 能够充当数字员工这一工种,也能够充当个人助理这一工种,还能够充当营销客服这一工种,切实为企业创造价值。

一些声音持有这样的看法,B 端 Agent 市场有希望率先实现规模的增长。当具体聚焦到各个玩家身上时,依据 The Information 的报道,OpenAI 打算为专业人士推出专门定制的 Agent,以便让其执行诸如销售线索分类、软件工程以及博士级研究等这类高级任务。对于“高收入知识工作者”,每月给予 2000 美元;针对用于软件开发的,每月给予 1 万美元;对于博士级研究代理,每月给予 2 万美元。

从目前的发展态势而言,AI Agent 极有可能最先在企业服务以及办公场景里落地。在企业服务这一领域,AI Agent 能够助力企业达成业务流程的自动化与智能化,减少人力成本,提升工作效率。在办公场景当中,AI Agent 可以变为员工的智能辅助,协助完成各类办公任务,改善办公体验。

IDC 发布预测,到 2026 年,中国 500 强数据团队中有 50%会使用 AI Agent 来达成数据准备和分析的目标,并且会成为重要的组织者与协调者;同时,40%的中国 500 强企业能够实现数据智能与 AI 模型智能的融合,以此来统一 AI 模型以及数据的综合治理政策、实践和技术。

不过,要真正成为 AI 助手对接企业存在不少难题。企业的业务流程存在差异,企业的需求也各不相同。怎样将 AI Agent 与企业的现有系统进行无缝集成,以及怎样将 AI Agent 与企业的业务流程进行无缝集成,这是关键问题。

AI Agent 需要具备高度的定制化能力与兼容性,以便能够依据企业的具体需求进行灵活的配置和调整。并且,企业对数据安全和隐私保护极为重视,在 AI Agent 处理企业数据的过程中,必须保证数据的安全性与保密性,以防止数据出现泄露和被滥用的情况。

落地并非易事,这需要算力、数据以及场景不断地扩展来提供支撑。幸运的是,市场的热情已经被激发,各个玩家都在为“让 AI 帮助人们做事”而奋力拼搏。

大模型与 Agent 深度融合后,一个更智能、更主动且更个性化的 AI 时代正在加速来临。在这一过程中,独角兽和大厂们都在加快步伐奔跑,没有一个愿意在时代面前落后。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274891.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息