Simplicity is the most ultimate form of sophistication. 简单是精致的最极致形式。
——达芬奇
都说 AI Agent 未来会迎来爆发,2025 年将成为 Agent 元年。然而,Agent 究竟会以何种方式爆发呢?真正能够落地到生活各个方面并解决问题的 Agent 又会是什么样的呢?这些都是我们一年多来一直在探索的问题。在我们调研的 400 多家国内外 Agent 相关公司里,有 43%的公司在从事 Company Agent 的工作,这类 Agent 主要是面向企业,专注于企业跨部门的事务;有 46%的公司在做 Role-based Agents,它们专注于某一特定的工作职能;而研究 Personal Agents 的公司占比为 11%,Personal Agents 专注于个人。从提升 B 端效率的角度来看,Agent 已经渗透到各个行业的众多场景之中,在营销领域逐渐成熟,在销售领域逐渐成熟,在客户支持领域逐渐成熟,在工作流自动化领域逐渐成熟,在软件开发领域逐渐成熟。老黄在今年 1 月的 CES 大会上曾做出一个预测,即“未来每个公司的 IT 部门,都将会转变为 Agent 的 HR 部门。”我们相信,在不久的将来,Agent 有能力重塑 SaaS 以及企业结构。特别值得一提的是 toC Agent 这一领域,它令人感到兴奋。倘若将 AI 时代全新的应用形态定义为 Agent,那么 Killer Agent 以及下一代的超级应用究竟会呈现出何种模样呢?我们认为,它起码得同时具备 AI Native 这一条件,达成 PMF,并且拥有高日活以及高留存。经过一番寻觅,我们最终在全新的夸克上,察觉到了超级 Agent 的踪迹。
从搜索框,到 AI 超级框
Agent 业内较为主流的定义是:Agent 能够通过用户的输入来进行环境的感知;Agent 可以通过使用工具来执行行动;Agent 还能通过基础模型结合长期和短期记忆来实现认知能力。
我们通过对全新夸克进行体验,发现夸克实际上是一个以推理和多模态模型为基础的超级 Agent,它的实现架构并不复杂,具体如下:
凭借多模态能力,借助输入框与用户进行交互,从而感知环境。
基于阿里自研大模型的能力,进行规划这一行为。它会根据用户的输入,智能地识别出用户的意图,然后委派特定的 Agent 去进行回复。
根据用户的需求调用不同的工具(Action)以实现精准回答,从而针对性地解决用户的所有指令。
在学术领域,拥有丰富且可信的行业数据库;在医疗领域,拥有丰富且可信的行业数据库;在教育领域,拥有丰富且可信的行业数据库。同时,还拥有独家知识库,这些数据库和知识库作为数据记忆(Memory),弥补了大模型本身在垂直领域知识方面的不足。
我们在调研中发现,有很多研究员以及开发者都在努力让 Agent 的架构和交互变得更加丰富。比如,他们构建相互通信协作的 Multi-Agent 系统,就是期望能够解决复杂问题。Anthropic 在 24 年年末发布的“Building effective agents”这篇文章中提到了他们的经验。他们认为,成功的 Agent 并非在于构建最复杂的系统,而是在于构建适合用户需求的系统。并且只有在简单的解决方案无法满足要求时,才会添加更多组件。这与乔布斯的产品设计理念相契合。乔布斯认为“Simple can be harder than complex”。
夸克此次的升级呈现出这样的特点——从表面上看像是做了减法,但实际上却增进了用户的体验。众多的功能被浓缩在了一个超级框里,只需一个入口,就能够满足用户在学习、工作和生活中所遇到的所有问题。
之前的夸克是优秀的搜索引擎和工具箱,用户凭借“搜索框”去探索世界并获取信息,通过 GUI 与各个垂直场景的工具进行交互。全新的夸克舍弃了传统的“搜索框”,将其升级为“AI 超级框”,这是一个全能助手。它的交互形态变得更为简约,并且借助 Agentic 能力能高效地满足用户的深层次需求。
极简的设计,更优的体验
在这差不多近两年的时间里,我们接触到了许多新奇且好用的 AI 产品。我们使用过不同的 AI 工具,也订阅了一些,并且每天在这些不同的 AI 工具之间穿梭。基于此,我们也遇到了新的问题,那就是如果能在一款产品上高效地实现所有的 AI 功能就好了。而全新的夸克超级 Agent 正好填补了这个空白。
夸克既实现了 All in One 产品,又实现了 All in One AI 超级框。用户不用在不同的产品页面间频繁点击来回穿梭,仅在主页的一个框内就能够满足所有需求。
我们之前的文章中提到过一个观点,LUI(Chat 交互)或许不是 GenAI 时代最佳的交互方式。在互联网时代,UX 设计的主流理念是“不要让我思考”,然而 LUI 却需要用户持续与机器进行对话,需要不断地思考和表达。对于一些较为复杂的任务,大多数用户缺乏耐心,甚至没有能力将需求表达清楚,需要找到与 GUI 相契合的结合点。
夸克对尺寸的把握很恰当。它通过一个 AI 超级框问答,将 LUI 的价值发挥到了最大程度。并且结合 GUI 给用户反馈了融合多模态内容的答案。
当我提出“口腔溃疡了怎么办”这个问题时,AI 超级框能够智能地识别出我的意图,然后将其路由给“健康助手”Agent 来专门回答该问题。夸克具备追问功能,基于之前生成的回答,我接着询问“可以吃车厘子吗?”,此时 Agent 理解我问的是“得了口腔溃疡后吃车厘子是否会有影响?”,并给出了中肯专业的回答。
借助夸克超级 Agent,用户能够以更少的提问(因为追问功能自带上下文记忆),获得更高效的回答(无需点击网页查看,直接就能得出结果),以及更可信的回答(依托三审三校医学知识库)。
比如我让夸克“帮我写个 2000 字关于 Agent 的研究报告”。它的体验很好,一方面把我的需求智能委派给了 AI 写作 Agent,另一方面跳出一个 AI 自动填充好的 GUI 表单,让我可以确认字数、标题和大纲等细节。
不识 Agent 真面目,只缘置身于其中
新夸克为何能被称作超级 Agent?它与其他 Agent 产品相比的优势是什么?其护城河又在何处?
鸭哥前两天的文章提到,Agent 产品具有三个复利价值,分别是工具的复利、数据的复利以及智能的复利叠加,并且这三点是夸克区别于其他 Agent 的差异性优势。
在智能(Model)层面,夸克基于强推理模型,能够更高效且精准地调度工具和进行知识库检索。
产品自身形成闭环,阿里自研大模型具有优势,在工具、数据和模型这三个维度上实现了协同发展演化,这铸就了夸克成为超级 Agent 的基础。
夸克 CEO 吴嘉昨日在朋友圈中表明:五年前,夸克曾提出要成为年轻人的全能助手,并且一直在为实现这一目标而努力。直至今日,凭借以往的产品积累以及新模型所具备的强大能力,他和团队认为终于能够通过一个极为简洁的“AI 超级框”来无限接近这一目标,这使他们感到十分兴奋。回想这十五年,先是有阿里云搜索,接着是 UC 浏览器搜索,而后到了夸克。我们期望:New Quark 能够凭借一个 AI 超级框,开启让用户进入 AI 世界的大门。
当前夸克的超级 Agent 处于雏形阶段,而完整态的超级 Agent 正在朝着我们走来。
最后,想以我们封面图的设计理念来结束这篇文章。
门后闪耀着的是关于 AI Agent 的繁星点点。
——特工宇宙
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274968.html