继大模型之后,“具身智能”成为当前AI浪潮中的新热点。在人工智能融入物理实体的过程中,人形机器人无疑是具身智能领域最具代表性的实体。
近日,人形机器人赛道又发生了一件大事!作为上海“模具上海”建设的一部分,AgiBot(以下简称“AgiBot”)携手上海人工智能实验室、国家和地方仿人机器人创新中心、上海库珀斯正式开源数据集AgiBot World,全球首个全功能、全场景、高品质人形机器人百万真机数据集来了! #源神智汇君再次开源#
作为人形机器人领域的一颗耀眼明星,自“华为天才少年”和“智慧君”彭智慧于2023年创立致远以来,公司备受关注,发展迅速。短短一年半的时间,已筹集八轮融资,其中不乏高瓴创投、百度创投、比亚迪等实力资本,整体估值已超过70亿元。
今年8月,继一年前推出首款元正A1智能机器人后,致远再次发布“元正”、“灵犀”两大系列共五款商用人形机器人新品,再次推动商用人形机器人市场向前发展。迈步。仅仅四个月后,致远也正式宣布“正式启动通用机器人量产”的消息。用彭智慧的话说,“致远机器人终于跨越了最初的差距”。
不过,虽然致远发展“坐上了火箭”,但业界更关心的还有另一件事,即彭智慧和致远高管多次公开提及的开源数据集问题。
把数以百万计的真机数据集和数以千万计的模拟数据集开源出来,相当于把它最核心、也是行业最需要的数据燃料倒了出来。志远真的会这么做吗?
现在,梦想已经成为现实,数百万真机的数据集真正到来了。业界的思考或许从这一刻起进入了一个新的阶段:致远是如何实现这一切的?人形机器人领域将会发生哪些变化?
以“真实”重新定义标准
就像我们熟悉的大型语言和视觉模型需要大量的文本和物质支持一样,如果你想获得一个性能优异、功能与人类非常相似的机器人,就不可避免地需要喂食大量的训练数据。
在致远选择开源之前,世界上最常见的机器人操作策略一般都是在Open X-Embodiment数据集上进行预训练的。这个大规模标准化机器人学习数据集是由谷歌DeepMind机器人团队和20多所知名大学共同创建的,可以覆盖多种环境和机器人变化。
事实上,公开赛的挑战巨大。机器人操作的核心是泛化能力。如果它只能完成少量的预设任务,或者适应非常单一的场景,那么面对新环境、新任务,必然无法实现“即插即用”,机器人产品也只能是它。可以去工厂流水线等环境,但飞进寻常百姓家只能是“空中楼阁”。
除了开放桌面任务之外,走向更现实的集成仍然是一个大问题。
相比之下,AgiBot World 的开源数据集无疑是对行业生态的颠覆! #智元开源,中国落地ImageNet到来#
首先,从辐射场景来看,AgiBot World主要采集自5大行业领域,涵盖了家庭(40%)、餐饮(20%)、工业/物流(20%)、超市(10%)等大部分生活服务场景。 %),而且都是1:1真实还原真实场景包括洗衣、折叠、熨烫、烹饪、洗碗、包装、移动桌子、安装内存模块、组装零件、材料分类等复杂的远程精确任务。每个场景的数据量都是巨大的。非常充足,收集效率非常高。
与Open X-Embodiment相比,Agibot World远距离数据规模提升10倍,场景覆盖范围扩大100倍,数据质量从实验室水平上升到工业级标准,真正实现全区域实景覆盖。
值得注意的是,机器人要完成许多长距离任务,需要在长时间跨度、变化复杂的环境中连续执行多个子任务,这极大地考验了机器人的多模态感知、运动控制、任务能力。规划和决策、能源管理、故障排除等能力。
AgiBot World很好地构建了这些能力系统,从而给机器人应用带来了巨大的改变:基于过去的数据集生成的人形机器人可能还在思考如何抓住桌子的边缘,基于AgiBot World生成的人形机器人已经可以参考“人类”的行为逻辑来决定抓哪边更好,并且可以配合两个机器人搬运桌子。
其次,从任务设计的角度来看,与业界现有的大规模数据集相比,AgiBot World的任务设计更符合实际需求。
除了行业“套路”之外,AgiBot World充分考虑了精细操作、物品条件、双臂配合、工具使用等,且单次情节对应的动作更加长期,包括很多集中在25s-25s之间的原子动作。 120个,涉及各个场景的3000多个项目,最终将更精细、更贴近原始行为的任务有机地结合起来,基本实现了“复制”人类在复杂环境下的原生交互方式,推动了具身化的发现算法。比较清晰的“尺度法则”。
例如,在汽车制造车间,过去的仿人机器人大多只能完成简单的装配、运输等单一任务,处理复杂任务的能力不太强。基于AgiBot World生成的人形机器人已经可以精确地处理复杂机器的许多零件。将它们组装在一起,或者检查焊接质量,真正替代了部分人力劳动输出。
正是基于真实的场景和任务设计,以及百万级数据的训练保障,AgiBot World才有可能创造更高层次的“飞跃”,呼应了智慧君“人形机器人是人类制造的”愿景,并为机器人操作提供更强的泛化支持。
这种用“真”来表达变化的方式,难道不是对人形机器人数据采集标准的重新定义吗?
本体平台强大,数据管控稳定
致远机器人合伙人、营销服务副总裁蒋庆松曾在接受采访时表示,“与互联网数据和模拟数据相比,真实的机器数据才是具身大脑真正需要的数据。”
真实的机器数据不仅仅是采集出来的,采集的效率和质量会影响最终的输出。数据集获取飞跃的背后,致远如何把控本体平台和数据质量?
在今年8月举行的新品发布会上,致远联合创始人彭智慧公布了体现智能G1到G5的技术路线图。其中,G1阶段需要大量人工执行任务,G2阶段主要面向柔性智能制造和交互服务场景,并已在很多实际场景中进行商业应用。 G3阶段基于端到端的数据驱动实现。机器人大规模学习。
在G3路线下,机器人通过具身大脑和小脑完成从多模态输入到机器人控制命令输出的端到端具身操作。致远基于G3路线推出了A2-W、A2、A2-D、X1-W等多款性能优异的数据采集体。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273823.html