电脑自己弹出来一堆网页?中病毒了吧!
但这回并非如此,还有可能是 AI 代理在为你查找东西并进行工作。
昨天世超前往中关村。世超在中关村参加了智谱的 OpenDay。世超在智谱 OpenDay 凑了个热闹。世超近距离观看了智谱 AI 最新 AutoGLM 的发布。世超近距离围观了智谱 AI 最新 AutoGLM 沉思的发布。
各种 AI 助手大家已经很熟悉,它们只会打打嘴炮。而智谱这 AI agent 已经不只是局限在你问我答的范畴了,它还能帮你直接动手去完成任务,能够进行归纳总结,并且可以提升答案的深度和广度。
据说,AutoGLM 具备先思考而后行动的能力,同时在行动的过程中也在思考。这听起来颇为高深莫测。
那具体效果咋样?世超当然也迫不及待地上手试了两天。
AutoGLM 的沉思功能表现良好。它可以帮助大家将复杂问题进行拆解,然后分步进行搜索。并且它的回答十分全面。不过在使用体验方面,还有一定的提升空间。
有了它,感觉以后再也不怕老板让写年末总结报告了。
参考官网几个用例,咱来看看具体测试效果是啥样的。
事先说好,世超将问题扔给它之后就去开会了。在整个过程中,世超没有碰过一次鼠标键盘。以下所有的操作解释权都归 AutoGLM 沉思所有。
先问问它,人形机器人技术对未来生产模式会产生怎样的颠覆性影响呢?
这问题,要是世超来处理的话,也得花费好长一段时间去思考。然而,很快地,AutoGLM 极为迅速地就将思考的步骤一一列举了出来,分别是一、二、三。
能思考,也有胆量去行动。AutoGLM 首先打开了知乎这个平台,接着在知乎上搜索了人形机器人在工厂环境下的最新案例。
它甚至知道筛选信息。
字太多不想看?它来帮你看。
二十分钟之后,AutoGLM 给出了一份总结报告。这份报告挺长的,不过它已经是几十篇网页的浓缩精华版了。
报告概括了人形机器人在制造业可能带来的生产模式变革,也概括了人形机器人在农业可能带来的生产模式变革,并且提供了对企业的建议,同时提供了对研究机构的建议。
要是自己看完这几十篇文章总结内容,二十个小时也未必够。
不知道你行不行,世超觉得自己不太行。
前几天 GPT-4o 的文生图模型发布了。有的差友在视频下面留下了留言。这些差友原本是做设计师的,现在却想要转去做水电工了。
怎样进行规划才能在六个月的时间内快速成为一名出色的电工呢?
AutoGLM 首先在知乎进行了搜索。搜索的内容是关于设计师转行做电工的相关信息。
别说,你真别说,这事看起来挺可行的,先例还不少。。。
知乎看差不多,再去搜搜小红书。
最后生成一份学习报告,这份报告详细地列举了在这六个月的每一个阶段的计划,包括要学习哪些课程,具备怎样的条件,以及要报名参加哪些考试。
所以各位先别慌,按这个计划来,现在转行还来得及。
没有比较就不会有伤害。世超进行了横向测试,在一些方面,AutoGLM 沉思不如一月份 OpenAI 推出的前辈 Operator 。
同样是进行搜索食谱的操作,接下来我们来看一看这两个 agent 的表现究竟存在哪些差别吧。
在官方演示视频中可以看到,Operator 完成了奶油蛤蜊意面食谱的搜索,且过程很丝滑。
接着看 AutoGLM 的沉思,提示要求它给出一份糖醋排骨的食谱。
抛出问题,它很快开始思考,列出一个 5 步详细计划。
需要登录信息或者有弹窗的时候,也要人帮帮忙。
在搜索栏输入关键词不在话下。
一开始 AutoGLM 沉思后的表现较为靠谱,能够顺利打开网页并搜食谱,让人感觉一切都在掌控之中。然而,当它打开了 4 个小红书页面、3 个 B 站页面以及 2 个知乎页面后,事情似乎开始变得不对劲了……
收手吧阿祖,是在家做糖醋排骨,不是国宴。
AutoGLM 有想要做得更好且更全面的感觉,它会持续不停地进行搜索,更换信源,或者说期望找到一个“最优解”以及一个“标准答案”。
但是面对“糖醋排骨怎么做”这样没有标准答案的问题时,它会花费很多时间去进行检索以及总结。
其实早就找到了答案,然而它或许是 INTJ 呢,一直都不太让人满意。
十多分钟已经过去。糖醋排骨在烹饪方式上,似乎怎么做都可以,然而又似乎怎么做都不行。与 Operator 相比,它显得非常纠结。
搜食谱之外,找路似乎也不太适合它。世超从中关村出来后,刚在颐和园痛快地玩了一圈,还想去北京大学看看。他惦记着刚刚得到的好东西,便想询问它从颐和园到北京大学的公共交通路线。
18 分钟后,搜索终于结束了。
最后展示的结果中,考虑到了地铁的情况,考虑到了公交的情况,考虑到了自行车的情况,考虑到了步行的情况等等,总结得非常全面到位。
唯一的问题是世超已经在北京的春风里瑟瑟发抖了很久很久。
它具有“沉思”的特性,这一点可能是它更适合解决复杂且需要思考的问题的原因。毕竟工具是要分使用场合的,不能用不合适的工具去做不合适的事情,就像不能拿大炮去轰蚊子一样。
世超在测试过程中确实遇到了一些别的细节问题,这些问题会对使用体验产生影响。
比如在网页搜索结果给出之后,有时候会等待很久,再进行点击。
对话框显示它未在思考,然而网页上也未在操作。身为旁观者的人类,目睹它停留在那里,答案就在那里,却无法亲自替它点击。
简直是新时代酷刑,焦虑值瞬间拉满。
这只是个 Beta 测试版。正式版是否会修复这些问题难以确定。
综合来看,AutoGLM 沉思作为一款免费的国产 agent,其表现是不错的。与 200 刀一月的 OpenAI Operator 相比,与一码难求的 Manus 相比,它的性价比真的拉满了。至少能让大家先没有痛苦地体验一下 AI 帮自己干活是一种什么感觉。
听说 4 月会进行开源操作,到那个时候可以再次前来观看,看看还会有哪些有趣的事情。
撰文:莫莫莫甜甜
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275272.html