腾讯科技《AI未来指北》特约作者 小燕
编辑 郑可君
直击人形机器人半马:天工Ultra冲在前,人类陪跑员喘在后
机器人在跑马拉松,后面跟着一群工程师。
4 月 19 日,首届人形机器人半程马拉松比赛在北京亦庄举办。20 多台人形机器人在比赛中“缓慢前进”,而几十位工程师在后方一路陪跑。他们的工作是忙着调算法、换电池以及抗干扰。
这场马拉松比赛,一方面是为了比速度,另一方面更是对人形机器人基础能力的验证。验证它们具备长时间运动的能力,验证它们具备连续运动的能力,验证它们具备自主运动的能力。
为什么要让机器人跑马拉松呢?因为实验室的条件是完美的,但这种完美无法模拟现实路况所具有的复杂以及不可控性。只有在连续 20 公里的真实环境里,关节结构、能耗效率、散热能力和运动算法才会被完全暴露出来,而这恰恰就是“人形机器人产业能否落地”所面临的第一道门槛。
腾讯科技在此时点举办的“具身之路”系列直播,邀请了三位嘉宾。这三位嘉宾长期关注机器人产业实践,并且深度参与其中。他们共同对这场“跑出来的能力测试”背后的真正技术焦点与产业价值进行了拆解。
核心要点:
1、为什么人形机器人需要一场马拉松?
马拉松并非是为了比拼速度,而是借助真实环境来进行一场“基础运动能力”的压力测试。在长距离且非理想的场地中持续运行,这是对人形机器人能否迈向现实应用的第一道检验门槛。
2、它暴露了哪些核心技术挑战?
一台机器人跑完半马,这背后全面暴露了关节精度的问题、热管理的问题、电源系统的问题、控制算法的问题以及通信干扰的问题。这是一场系统工程的极限演练,不仅仅是测试它“能不能跑”,更是测试它“撑得住多久”。
3、跑步能力能否迁移到真实场景?
马拉松仅仅是一个开端。如果机器人能够完成长时间的稳定运动,这就意味着它开始具备进入安防、巡检、配送等需要高负载的场景的可能性。然而,真正能够决定其商业化落地的是,在“小脑”能力实现标准化之后,“大脑”是否能够迅速跟上。
以下为直播的嘉宾发言精华整理:
人形机器人为什么需要一场马拉松?
Nixon 说:“我们先来聊一个轻松的话题吧。当你们听闻‘人形机器人跑马拉松’这件事的时候,你们的第一反应是什么呢?是认为这很大胆呢,还是觉得有些离谱呢?”
于浩称自己当时的确感到惊讶。之前有媒体找他聊过“机器人爬山”的这个想法,他觉得难度非常高,实施起来极为困难。然而,没想到没过多久就听闻要举办“机器人马拉松”。
起初,我以为比赛要求机器人在全程中自主运行。在了解之后发现,主办方是允许使用“遥控”这种模式的,甚至还允许“跟跑”模式。整体来看,门槛并没有想象中那么高。但这也不能说是件不好的事情。毕竟目前的人形机器人在技术方面还不够成熟,在应用方面也不够成熟。与其将比赛当作一种竞技,不如将其看作一个展示平台。不同企业带来的机器人各式各样,有的高有的矮,功能也各不相同。这些机器人既能展示自身的优势,也能暴露自身的短板,对于行业来说,是互相观摩和交流的好机会。
我们常说的是“PDCA”循环,它包含 Plan(计划)、Do(执行)、Check(检查)、Action(处理)。这是一个闭环管理流程。通过实践,能够暴露问题,然后进行优化,这是一个很好的闭环过程。
谌威称:这是行业向外界展示阶段性成果的契机。如同赛车那般,并非仅凭借一台车,而是其背后有完备的保障体系予以支撑。人形机器人若要“跑起来”,其背后同样需要一个协同配合的团队。此次马拉松的意义,不在于比拼谁的速度快,而在于是否有勇气迈出这一步。
从参赛方式方面来看,当前“遥控”处于主导地位。“跟跑”模式对环境有着较高的要求,并且其稳定性也不是很好。通常需要有一个领跑员,该领跑员要与机器人保持三到五米的距离,其身上贴有二维码或者其他的识别标识,然后机器人借助视觉追踪技术来实现跟随。这种方式在识别精度和路径控制方面都有很高的要求,容错的空间是非常小的。
说到底,这是一项系统工程。两台机器人即便外形完全一致,它们在摩擦力、限速设定、调校精度等细节方面也可能存在差异,进而导致跑出来的轨迹可能完全不同。
谌威表示没错。每台机器人都得有专人来进行调试。即便只是两条腿的摩擦力存在不一致的情况,都有可能对行走路径以及整体稳定性产生影响。
现在的机器人,并非是“即插即用”的设备,而是一个极为复杂的系统集成体。正因如此,这非常耗费人力。仅仅是准备一台参赛机器人,就有二三十人参与其中,并且涉及到算法开发、硬件调试、现场运维等诸多环节。
大家担心机器人“抢饭碗”,其实现在看来为时尚早。从现在的情况来看,一台机器人的运作背后,或许需要几十个人共同来推动它向前发展。
我之前曾开玩笑讲,要跑一场机器人马拉松的话,起码得有个人跟着去背电池,并且还要做维修工作。这不但没有将人类的工作给取代掉,反而还催生了一些新的工作岗位。
谌威称:不少机器人公司仅现场执行的团队就有三人。其一负责操作控制;其二处理突发情况;其三负责后勤保障,且会跟着保障车一同行动。保障车上会装载备用电池、电源以及支架等设备,以此来确保机器人在遇到问题时能够迅速应对。
足球比赛中有医疗团队随时待命,这边的情况也是如此,它可以算是“机器人马拉松的医疗车”。
谌威表示是的。主办方设置了七个补给站,这些补给站每隔三公里就会提供电池更换服务以及必要的物资。其保障体系较为完备。
尼克松特别想强调此事。此次是半程马拉松,而非全马。主办方鼓励企业通过一台机器人跑完全程,同时允许在中途进行更换机器人以及更换电池等操作,只要能在时间限制内完成就行。
这次的关门时间比人类半马的关门时间延长了半小时,这是因为考虑到机器人整体速度会更慢。所以,这场比赛考验的不是谁跑得最快,而是谁能够稳定且安全地坚持到终点。
谌威表示,这次比赛的特别之处在于,所有参赛企业都在统一标准下诚实地展现自己的技术状态,而不再像以往那样通过剪辑来呈现“机器人陪我一天”的表演场景。对公众而言,这次是极为难得的真实展示,同时也是一种科学普及。
一场长跑,能否证明人形机器人核心竞争力?
接下来我们深入聊一聊。从机电系统这个角度来看,机器人要完成一场马拉松,核心挑战有哪些呢?从控制算法这个角度来看,机器人要完成一场马拉松,核心挑战又有哪些呢?
谌威表示,从系统层面来看,其中最核心的挑战之一为关节设计。目前整个行业大致可分为三种方案,分别是谐波关节、行星关节以及直线关节(行星滚柱丝杠)。
它们在减速器结构方面有差异,减速器的功能是把电机的高速且低扭矩转变为适合关节运动的低速且高扭矩。减速比不一样,会对机器人输出的效率以及响应能力产生直接影响。
打个比方,就如同骑自行车时换挡一样,在不同的挡位下,踩踏所产生的感觉是完全不一样的。例如那些能够跳舞、做出鲤鱼打挺动作的机器人,大多会采用高响应且高效率的行星关节,这些机器人的整机高度大约在 1.3 米左右,由于重心较低,所以平衡性很好。
关节结构会影响机器人的运动表现。算法能力会影响机器人的运动表现。身高体型会影响机器人的运动表现。这些要素都会共同对机器人的运动表现产生影响。
谌威表示没错。其中一个关键挑战除了结构方面外,还有散热。运动强度大的机器人,其电流较大,发热量较高,甚至可能达到普通方案的三到四倍。只有解决热管理问题,才能够确保机器人长时间稳定运行。谐波关节方案的功率虽然不算特别高,但是能够持续运行一到两个小时,这种方案适合长时间任务。
尼克松问,如果热控方面没有问题,但是速度不够的话,是不是就只能以缓慢的方式“行进”呢?
谌威说,热控稳固的机器人,或许牺牲了速度。它的表现更像是在稳定地“行走”,而不是在快速地“奔跑”。
在软件算法层面,现实环境与实验室存在很大差距。比如亦庄这次的赛道,其地面并不平整,中间部分略高,两侧稍低,并且还可能出现减速带和碎石。这种复杂的地形对算法的鲁棒性提出了很高的要求,即机器人在受到干扰时必须依然能够保持平衡,不然很容易出现偏移甚至摔倒的情况。
Nixon 表示:行业大致可分为两类机器人。一类是“等人高”的大个子机器人,这类机器人虽然跑得慢,然而它稳定且持久,适合进行长距离任务;另一类是身高约一米的小型机器人,这种机器人动作快且灵活,不过它的续航能力较弱,适合在表演型场景中使用。
谌威表示可以这样进行划分。大体型机器人着重于能否减少进入补给站的次数以及能否稳定且持续地运行;小型机器人则侧重于速度和动作的表现。
尼克松询问于浩老师,从投资者的角度出发,如果将“马拉松”当作一个能力背书,那么它究竟能够代表哪些技术水平呢?
于浩:我觉得这要看具体的比赛模式。
如果是遥控模式,主要考察的是硬件方面的能力,像关节、电机、能耗以及散热等;如果是全自主模式,那就要求机器人具备环境感知、路径规划以及动作决策等能力,且难度更大;跟跑模式是另一种情况,需要机器人能够精准跟随并且快速响应前方目标。
所以三种模式在能力要求上存在本质区别。然而,不论属于哪种模式,关节强度、热控能力以及系统鲁棒性这些底层指标是相通的。尤其在马拉松这种长距离的场景里,更易于暴露系统级的问题。
足球队比赛前要进行踩场,与之类似,机器人也需要提前去适应实际场地。在现实中,可能会碰到各种无法控制的因素,例如突然刮起大风,或者其他机器人摔倒等情况,而这些情况都要求在算法层面做出迅速的判断并且进行相应的调整。
Nixon 表示确实如此。如果机器人遭遇到坡道或者强风,那么它要怎样去保持平衡呢?
这要视情况而定是否为自主控制。若为遥控,那么依靠人去判断环境并且手动进行干预;若为自主模式,就需要借助机器人大脑中的感知系统实时作出决策。
谌威称:机器人在进行行走、爬坡或者步态恢复等动作时,其所有关节模组的数据以及其他传感器数据,都会被建立在控制芯片中。控制芯片会实时对参数进行调整,并且在一秒钟内能够向机器人身上的电机发出近千次指令,以此来维持整个机器人系统的平衡。
也就是说,在遥控模式下,机器人依然需要具备一定的“自我判断”能力。并且,遥控主要起到的是导航的作用。
谌威称可以这样理解。自动驾驶是依靠高清地图来进行导航的,然而机器人目前还无法做到完全相同的路径规划。在维持平衡这一方面,最终依靠的是机器人自身的大脑来进行实时的判断和决策。
不同厂商在模型训练以及算法实现方面存在着较大的差异。有些机器人经过了专门的训练,能够上下坡和台阶;而有些机器人则只能应对平地。我们钛虎主要以硬件为主,同时也在积极地引入各种不同的算法以及开源框架,并将它们与我们的产品进行融合,以此来提升产品的适应能力。
Nixon 表示明白。在户外“开放式马拉松”中,除了运动控制和环境适应之外,还有哪些关键瓶颈需要突破呢?
谌威称挑战较多。其一为结构稳定性方面,机器人在长时间且高频的运动过程中,会持续遭受震动与冲击。若结构件的设计不合理,便极易出现松动乃至损坏的情况,特别是在金属材料反复受力时,会产生“金属疲劳”现象,进而致使强度降低甚至发生断裂。而这在长距离、高强度的马拉松运动中尤为需要加以重视。
另一个关键问题为换电。实验室常用直连电源或标准电池包,然而户外比赛需快速换电,热插拔结构最为理想。部分厂商已进行此方面设计,例如主控电源具备备用供电模块,主要电池如同无人机那般,能够“一插即用”,整个更换过程仅需不到一分钟。
我们常说“热插拔”,意思是在机器运行过程中可以更换电池且不会中断机器运行。有些观众可能对这个概念还不太熟悉,所以有必要对其进行简单解释。
谌威表示,在不关机的情况下就可以完成电池更换,这样做效率更高,并且也更加安全。
尼克松明白了。刚才你们提到了“金属疲劳”这个问题。通过一些资料,我们确实看到了不少与之相关的损伤案例。
金属疲劳是一个重要因素。还有一个容易被忽略的问题,那就是通信干扰。你想象一下,现场有很多机器人同时在运行,它们全靠无线信号连接,而这些信号之间是非常容易互相干扰的。
谌威指出,在赛道周边存在地铁的情况下,以及人群密集且手机信号重叠的地方,干扰会更为明显。
机器人自身带有众多电机,电磁干扰较为强烈。当下还缺少统一的赛事标准,不同厂商的通信模块或许都在相同频段上工作,如此便容易引发系统层面的干扰风险。
还有一点需要强调,现在有很多人对人形机器人抱有极大的期望。然而,实际上人形机器人的难度要比自动驾驶还要高。汽车仅仅需要在二维平面上进行控制,而人形机器人采用双足运动,这涉及到平衡的保持、重心的变化以及动态反馈等一系列极为复杂的变量。所以,我们应该对这项技术保持足够的理解和耐心。
Nixon 表示确实有这样的情况。例如有机器人公司曾公开宣称,在他们的测试过程中出现过脚踝结构断裂的问题。并且有的团队尝试让机器人“穿鞋”,据称这样做能够明显提升机器人的续航以及跑速。大家倘若有机会去到现场,就可以留意一下“穿鞋”与“不穿鞋”所存在的差异。
谌威说:人形机器人若金属脚直接着地,那么震动会极为强烈。而穿鞋的话,确实能够起到一定的减震效果。
于浩提出一个疑问,即穿鞋是否会带来更多的不确定性呢?像鞋底的摩擦系数以及结构的稳定性等这些因素,会不会反而引发新的问题呢?
谌威称:当下大多数机器人的“脚底”结构,实际上并不具备如同人类鞋子所具有的摩擦力以及人体工学方面的属性。穿鞋这一行为,实际上是借助了人类经过长期演化而形成的成熟减震工具。有部分机器人公司正在尝试去开发橡胶脚垫的版本,期望能够在减震性能与结构稳定性之间达成平衡。
我理解了。从工程角度去看,结构要是越复杂的话,变量就会越多。能否通过比较简洁的设计来实现同样的效果,这也是值得去探索的。
Nixon 询问,在长时间运动的情况下,关节的散热问题该如何解决呢?例如跑完整个 21 公里,一个关节可能需要连续运动十几万次。
谌威称:当下大多数机器人主要借助金属外壳来进行被动散热。从技术层面来讲,大家的核心想法是从电机本体着手去解决发热的问题,例如通过对绕线方式进行优化、提升减速器的效率以及改进金属结构的导热性能等办法,以达到降低热量积聚的目的。
最终目标是提升关节的“扭矩密度”。具体而言,就是在结构更轻的情况下,既能够实现更高的输出,又能够降低发热以及电流负载。另外,谐波减速器与传统的行星减速器相比,它在散热效率方面具有优势,并且在整体性能上也有优势。
很多研究报告现在也在强调,谐波减速器在人形机器人中是核心零部件。
于浩表示没错。机器人的运动与汽车不同。我们常提及“加速容易,减速难”。尤其在机器人跑步进行减速的过程里,控制算法是极为关键的。这个阶段通常需要双脚同时施加力量,并且平衡与协调性都处在最不稳定的状态。
Nixon 表示,人形机器人在减速阶段需双脚同步发力,加速时主要依靠单脚发力。这种“双足协同”的控制逻辑,既对系统的协调性提出了更高要求,也对控制算法提出了更高要求,就如同人类双手协同操作复杂任务一般。那么,下肢在减速阶段的这种配合,是否会在算法层面带来额外挑战呢?
于浩认为确实如此。在减速阶段,最为关键的事情是保持平衡,并且还要对双脚之间的协调配合进行处理,此时算法的难度会变得更高。
谌威称,如果要从算法层面进行细致的讲解,或许需要专门的算法团队来进行展开。当下行业中主流的做法是运用“统一框架+自我学习”的策略去解决问题,例如借助强化学习,将加速、减速以及在不同地形等各种状态都通过训练而涵盖进去。
所以不是将每个动作都用明确的规则固定下来,而是借助大量的数据进行训练,让这些状态得以呈现出来,从而使机器人逐步学会应对各种复杂的情形。
Nixon 表示明白了。意思是像前进、减速、转弯这类状态的切换,并非通过具体的规则一步步去控制,而是被整体打包进强化学习模型里,使系统在运行过程中能够自己去“学会”。
谌威表示:依靠的是进行大量的训练以及数据的积累,通过不断地对模型进行优化,从而使机器人在各种不同的状态下都能够做出合理的反应。
既然是比谁跑得快,那为何不用机器狗呢?四足机器人目前的运动能力比较强,有的还结合了轮腿结构,其效率和速度都更为优越。那么,为什么这场马拉松一定要用“人形”机器人来跑呢?这其中背后的意义究竟是什么呢?
我们最近确实讨论过这个问题,那就是为什么一定要“人形”呢?我觉得这与人类对机器人的长期想象存在关联。
小时候看《铁臂阿童木》,我们心中“机器人”的原型是有手有脚、像人一样的存在。这种“人形”形态仿佛是一种文化符号,同时也是一种心理投射。就如同中国神话里女娲造人,是用黄土捏出人的模样。人形机器人在一定程度上承载了我们最初对工具的想象,它要像我们,要替代我们,要进入我们原本的位置。
从实用角度来看,人形确实更适宜进入人类环境。比如爬楼梯时,人形结构能直接适配;开门时,人形结构也能直接适配;扶电梯时,人形结构同样能直接适配;坐办公桌时,人形结构依旧能直接适配。而机器狗或其他异形结构则需要对空间和工具进行重新设计,整体改造成本较高。
人形是一种替代形态,通用性更强。即便它在效率方面不是最优选的。
谌总,你从事关节相关工作。从产品落地的角度出发,人形和机器狗的区别在哪里呢?
谌威说:这次是马拉松比赛。马拉松本身就是人类的竞技项目。人形机器人参与其中,在形式上是合情合理的。从功能方面来讲,我总结出了以下几点:
这个世界是为人类而设计的。人形机器人在空间适应性方面具备天然的优势。
第二,当下的工具以及界面大多是为了服务人的身体结构而存在的。例如,把手的设计、按钮的设置,还有工具的大小与高度等,都是以人的身体特征为依据进行设计的。而人形机器人能够与之实现无缝对接,无需进行额外的改造。
第三,统一的形态具备有利于规模化生产的优势。汽车的“四轮”已然成为工业标准,而“双足+两臂”的人形同样是一种能够标准化的工业形态,这种形态有助于进行复制以及降低成本。
第四点很关键,涉及数据迁移方面。人类的行为数据能够直接用来训练人形机器人。然而,若要将这些数据迁移到机器狗等异形结构上,其训练成本会更高,转化效率也会更低。
这次比赛并非仅仅是为了“跑”,其本质在于对人形机器人的“基础身体能力”进行测试。我还记得去年在世界人工智能大会上,在全国范围内,真正能够“走起来”的机器人数量其实并不多,大部分还需要借助吊装来辅助。
但这次情况有变,大家的机器人开始活动、行走了。这表明在系统稳定性、关节性能、控制算法等领域,行业已逐渐跨过了“能够动作”的界限。马拉松是很适合进行“压力测试”的场景,如同人类进行体检,必须先通过基础体能测试,才可以进入更高阶的任务。
之后我们或许会见到更多不同体型的机器人亮相。不只是标准身高的一米七,或许两米高的那种大个子也能够参与进来。这表明整个行业正在往前迈出显著的一步。
尼克松说刚才提到了数据训练,这很关键。我们难以让真实的狗为机器狗做标准示范,然而人类不一样。人类在各类真实工作场景中的行为数据,能够被直接采集并且进行结构化,可当作人形机器人学习的输入。训练效果的关键就在于数据的时间跨度以及规模大小。
谌威表示,人类的数据具备天然的特性,这种特性是高度结构化的,并且非常适宜迁移至人形机器人系统当中。这也是人形形态在“学习效率”方面更具优势的一个关键原因。
人形机器人参与马拉松,是否具备实际应用的迁移价值?
尼克松说:我们开始进入今天的最后一个部分。现在我们能够看到,有些机器人在马拉松比赛中展现出了较为强大的耐力,而有些机器人则更侧重于动力性能。你们对此是怎么看待的呢?这些能力是否有可能迁移到实际的应用场景中呢?例如在安防以及配送等需要长时间运行并且路况较为复杂的环境中,是否能够借助这些能力来建立起更强大的工程能力呢?
谌威认为答案是肯定的。马拉松对于机器人来说,实际上是一种基础能力的测试。未来的真实应用场景,对机器人的要求会更高。在工厂中,机器人或许需要连续运行八小时以上,而目前主流人形机器人的续航能力通常仅有一到两个小时。像电网巡检、山区作业这类任务,地形较为复杂,对机器人保持动态平衡的要求更为严格。核工业这种特殊场景存在,并且还涉及强电磁干扰等问题,这对系统稳定性构成了巨大挑战。
未来的机器人形态必定是高度定制化的。我们提供的是一套人形平台方案,然而在真正落地时,必须依据不同行业的具体需求进行二次开发。这就是我们强调“从本体关节出发”来构建可扩展系统的缘由。
于浩认同。这次比赛中体现出的情况,无论是技术优势还是暴露的问题,都将对研发工作起到反哺作用。像关节疲劳、电源管理、散热策略等方面,都是下一阶段能够重点进行优化的方向。
马拉松本质上是一个场景,这个场景的任务目标单一,交互行为也较少。然而,它为我们提供了一个“能力压测”的窗口,这个窗口强度高、周期长。对于产品稳定性和算法鲁棒性而言,它是一个非常有价值的检验平台。
未来的机器人形态并非仅有人形这一种,也不一定非得依靠电池来供能。在工业场景里,完全能够通过外接电源去解决续航方面的问题;甚至有些应用场景连下半身都不需要,仅仅有上肢系统就可以独自完成任务。
谌威说:我们有客户只采购双臂系统,而不需要完整的人形平台。
于浩认为关键是找到“最合适的机器人形态”以完成“最合适的任务”。扫地机器人就是一个极为成功的范例,其轮式结构稳定且高效,这反而更契合它的功能。倘若将其做成人形,那就属于多此一举了。
我曾在高校见到过一台刀削面机器人,它仅有两只机械臂,没有下半身。然而,它却能够连续且稳定地完成任务。这便是典型的“形态合适”。
所以我们举办这场马拉松,不是为了去验证“机器人能否跑完”这件事。而是通过这个过程去进行探索,探索哪些能力具有迁移的价值,以及哪些技术能够在不同场景中进行集成。
Nixon 表示理解,如今大家对人形机器人的关注,很大程度上源于它们的“运动能力”达到了某个特定界限。尽管它们当下还无法承担复杂的感知或服务类工作,但仅仅凭借“能够行走、能够奔跑、能够保持稳定”这些特点,就已经可以登上春晚的舞台,也能够出现在展会等场所。
马拉松将这个“运动能力”推向了极限,它需要长时间运行,能够高速切换状态,并且结构耐久可靠。
我设想,未来是否能够依据体型、驱动结构来设立分组呢?例如设立 1 米 2 和 1 米 7 这两个身高等级。如此一来,厂商就会围绕这些标准化的目标展开专项优化,就如同汽车拉力赛一样,能够推动行业建立分级标准,并且带动上下游的配套发展。
在这次比赛里,最大的挑战或许不是算法,而是底层的机电系统。要是能够提高能量转化的效率,那就意味着机器人能够跑得更远,并且工作的时间更久。
谌威说他要补充一点。人形机器人在短时间内确实更像是一个技术探索的方向,它所推动的是整个行业的“能力上限”。然而在这个过程当中,很多关键模块会向下沉淀。
过去在工业自动化场景里,人类还需要介入去处理那些非结构化的复杂任务。然而,当我们把人形机器人路径中所发展出来的智能模块,像视觉识别、多模态控制等,移植到传统机械臂系统中时,它就能够立刻胜任更多种类的产品以及更复杂的任务。
人形机器人的意义在于,它并非仅仅要去“通用替代人类”,而是撬动了整条产业链对“复杂智能”进行重新构建。
单臂演进到双臂,提升了操作的自由度,同时拓展了任务的复杂度。于总曾说,人形不一定是“双足+双臂”的完整形态,“双臂优先”的构型在很多实际场景中极具价值。
未来我们能否增加一些新的测试项目呢?比如去评估操作能力。让机器人在封闭空间里完成像洗碗、做饭这样需要感知和精细动作配合的任务。
于浩看到这次已设置了“人气奖”这种软性评估指标。未来或许可以考虑将“互动性”测试引入进来,例如拟人面板以及交互逻辑等设计,使机器人能通过更具表现力的形象与观众构建起联系。这体现了人机关系的一种发展演变趋势。
尼克松说:“我们最后来讨论一个现实问题。今天参加比赛的那些企业里,有些企业的表现非常出色。在投资人的眼里,这些表现出色的‘领先者’是否具备真正的成长性呢?它们的商业模式是否已经有了清晰的路径呢?于总,你对此是怎么看的?”
这是一个极为现实且重要的问题。我们将这次马拉松视作一次“技术嘉年华”,目的是让更多人能直观地知晓机器人行业的发展现状。然而,回归到投资逻辑上,最终决定一家企业能否长久发展的,依旧是商业模式是否能够成立,即技术能否与实际场景相衔接,能否形成一个闭环。
技术即便再先进,倘若没有合适的落地场景,就很难构建起可持续的商业循环。中国的优势在于其产业基础是完善的,应用场景也是丰富的。只要能够找到真实的需求侧,就有机会形成“技术、应用、成本”三位一体的正向生态。
从控制论的视角而言,这实际上是一个“正反馈回路”。成功的应用会促使技术走向成熟,而成熟的技术又能够进一步提高应用的效率。大模型的火爆,便是这种“涌现机制”的典型事例。
我认为在机器人这个领域中,“应用落地”依然是主要的发展方向。投资人需要与研发人员紧密合作,同时商业团队也要参与其中,大家一起去寻找合适的应用场景以及合理的成本结构,只有这样,整个行业才能够迈向成熟。
Nixon 表示确实如此。商业模式并非一开始就清晰确定。当人形机器人刚开始能够跳舞时,没有人预想到它能够登上春晚并且成为舞台的主角。这便是应用的自然发展演变过程。
在国外,存在这样的情况:有人提出了“养老机器人+保险服务”的组合模式。并且,从政策方面、法律方面以及支付体系等各个环节来看,都需要随着产业的进展而逐步进行构建。
谌威:从我们产业内的理解出发,机器人系统可以被拆分为三层:
第一层是硬件本体。第二层是“小脑”,它指的是控制算法。第三层是“大脑”,它指的是任务规划与决策系统。
这场马拉松主要测试的有两个方面:本体以及小脑能力。在接下来的一到两年时间里,小脑能力有希望变得标准化,像核心的行走、跳跃、避障等这些功能将不再成为差异化竞争的要点。
到那时,真正会拉开差距的方面有硬件性能、制造成本以及精度控制。并且,能否实现规模化落地,归根结底要看“大脑”这一层是否能够建立起来。
目前大脑系统正处于快速进化的阶段。例如,Figure 公司凭借大模型能力促使系统进行迭代,仅仅一年的时间,其估值就增长了 15 倍,达到 300 亿元人民币。英伟达也刚刚将类似的整套智能架构进行了开源,这表明行业的门槛正在迅速被拉平,国内的团队有机会在几乎相同的起跑线上参与竞争。
我们判断,在接下来的 1 到 2 年时间里,机器人大脑将会迎来一个快速提升的阶段。即便处于过渡时期,也能够运用“传统视觉加上轻量规划再加上任务调度”这样的组合策略,先将一些实际应用落实下来,像商超进行巡检、药房进行配送、安防展开巡逻等,许多国内的团队已经开始进行部署了。
借助数据训练与模仿学习,有望在重复性高的场景中实现局部智能能力的实际应用。
Nixon 表示今天的分享是很完整的。谌威刚才针对“从小脑到大脑”所做出的这段回应,为我们的讨论起到了很好的收尾作用。
总结而言,我们的判断为:马拉松能够促使行业确立起“基本运动能力”的标准。并且,在“小脑”趋于一致之后,接下来的阶段比拼将会在“大脑”与场景的适配方面展开。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275559.html