1. 首页>>分享

布局底座技术的公司如何生长空间数据能力?群核实例

图片

部署基础技术的公司如何开发具有物理正确特征的空间数据能力?

文字|徐新

编辑|任晓宇

2019年的一天,当一名算法工程师在杭州市拱墅区莱茵矩阵国际大厦一间办公室打开邮箱时,怀疑自己收到了一封诈骗邮件。

这封邮件全是英文,加上签名和公司后缀,看起来像是来自一家市值万亿美元的硅谷知名巨头。对方发出合作邀请。这是群和空间智能平台首次接触第一个硅谷巨头客户的小插曲。

当时,群芯空间智能平台产品的概念还停留在纸上。在2018年发表的这篇论文中,群禾科技基于自身业务海量的室内空间数据积累,联合伦敦帝国理工学院、南加州大学,在BMVC会议上推出了InteriorNet数据集。

在业界现有开源数据大多为静态、非交互式数据的背景下,这个全球最大的室内场景认知深度学习数据集为机器人在室内空间的训练和探索提供了数据基础。随后几年,硅谷巨头和多家实体智能公司纷纷向集团核心伸出了橄榄枝。

20日,群禾科技在第九届酷+科技峰会上正式发布了这款面向空间智能技术训练需求的新产品——群禾空间智能平台。从产能储备到成熟上市,这个过程也暗中契合了群合科技的发展节奏——科技公司可以根据市场需求,从技术基础上不断培育出意想不到的、符合逻辑的产品。产品。

但为什么是群禾科技呢?为什么这样一家名不见经传的公司拥有连硅谷巨头都需要的空间智能数据能力?

01

群禾科技是谁?

大众或许对群禾科技不太熟悉,但酷家乐却很多人都熟悉。是群禾科技技术基地培育出来的产品之一。

作为国内家居设计师中知名的3D空间设计平台,酷家乐自2013年诞生以来,将原创家居设计行业的设计绘图周期从几周压缩到几天。同时,操作流程也大大简化。用户可以通过拖动3D模型和简单的布局来快速完成设计和渲染过程。

“世界上唯一的武术就是速度。”极致的效率和更简单易用的体验,让酷家乐应用于家居设计、建筑、电商、连锁商业、文化会展、广告营销等多个行业,实现设计、生产效率的提高。

极致效率无疑是集团核心产品的最大标签之一。而这个标签来自于群禾科技自成立以来的技术基础。组核的英文“manycore”是一种GPU架构的名称。如今,国内外都在加速建设更大规模的计算集群。增加计算单元以提高计算速度已成为业界共识。然而,在2011年,高性能计算还很小,当时计算机识别一张猫的图片需要19个小时。

群禾科技的三位创始人黄小黄、陈航、朱浩都是美国伊利诺伊大学的硕士生,拥有GPU并行计算和计算机图形学背景。他们之所以有机会离开英伟达、微软、亚马逊等海外大公司,回国创业,也是因为他们开发了一款物理上正确的快速渲染器,想要在中国寻找这种高性能计算的应用场景。

家居设计并不是最初瞄准的市场,而是群禾科技经过产品市场匹配和商业模式探索后找到的高性能计算技术的第一个落地场景。

这个场景的痛点很明显,渲染设计图需要大量的计算能力。群禾科技解锁了GPU能力,实现了家居行业的效率革命。渲染图像的成本大大降低,渲染速度也大大提高。这款产品也迅速在设计师中迎来市场爆发。

与酷家乐在空间设计领域渗透到更广泛人群、更多场景的同时,群禾科技在计算机图形、渲染领域的底层技术能力也在同步进化。

图片

家居设计方案渲染出来的画面的保真度和效果与消费者的付费情况有关。为了更好地服务这个场景的用户,群芯围绕GPU渲染能力逐渐形成了强大的3D渲染引擎。它拥有光线追踪、端云融合等能力,再加上AI技术,可以实现真实、实时的极速渲染。

群禾科技CEO陈航在Cool+科技峰会上以“群禾奇珍渲染引擎”命名。谈到“奇珍”的由来,他颇有些感慨。群禾科技董事长黄小黄和CEO陈航的本科母校浙江大学就有七珍湖,毗邻图形图像国家重点实验室。这也是群禾科技梦想开始的地方。

“启真引擎想要解决的问题是在数字世界中构建人们对未来的想象,并在3D可视化维度上保持其物理正确性。”陈航说。

图片

与更加真实高效的渲染能力同步,群禾科技在酷家乐的设计方案与柔性制造生产的对接过程中,还具备使设计方案在3D结构层面上物理正确的能力。群禾科技将命名为集团核心矩阵CAD引擎。

具体来说,该引擎可以将定制橱柜设计图转换为 3D 空间平面图。通过几何参数引擎和BIM引擎,还可以直接落地到物理世界的生产建设环节。例如,定制橱柜的图片可以恢复为3D结构,可以由工厂直接生产。

之所以能做到这一点,是因为群和有自主研发的数百亿参数的大型多模态CAD模型。这种参数驱动模型比大型语言模型中对空间的模糊和不确定描述具有更准确和结构化的空间表示。陈航认为,这是人工智能在物理世界产生价值的基础,“所见即所得”的世界不再遥不可及。

图片

受到硅谷巨头青睐的群合空间智能平台,是群合两大引擎基础能力在新的市场需求和行业痛点下的又一成果。

正如酷家乐是GPU算力在家装市场的应用场景一样,基于酷家乐平台多年积累的海量渲染设计解决方案的空间智能数据平台,也是群合两大基础引擎打磨出来的有效产品。技术。具有物理正确特性的空间数据能力可以在机器人训练领域的实际场景中找到,例如体现智能。

它不是规划和设计的结果,而是公司自然的创新路径,奠定了基础技术。

02

与Sora不同的世界模拟器

今年2月Sora发布后,人工智能行业就开始了关于Sora是否是世界模拟器、Sora能否理解物理世界、Sora为何是世界模拟器的讨论。重点主要在于索拉能否正确遵循物理学,真正理解和认识物理世界。

尽管有人称赞Sora是一个数据驱动的物理引擎和一个可学习的模拟器或“世界模型”。不过,Meta首席科学家Yann LeCun认为,基于语言提示生成的逼真视频并不意味着系统真正理解了物理世界。 “内容生成”实际上与世界模型中所做的因果预测有很大不同。

银河通用大模型负责人张志正对于通过Sora的视频生成来实现AGI也持怀疑态度。 “在数字世界中,通过预测下一个代币,可以实现一定程度的通用智能。”张志正在酷+科技峰会圆桌会议上指出。然而,如果AI想要发展为AGI并达到新的水平,它必须利用物理世界的知识。学习数据并与数据交互。

图片

目前,具身智能被业界视为模拟器全球最大的应用场景之一。与传统机器人预先定义一些动作,然后重复执行这些动作来完成自动化不同,具身智能将机器人的动作与语义和用户指令联系起来,让机器人能够概括和理解各种指令,完成物理世界中的各种任务。操作。

在这种场景下,世界模拟器可以用来生成大量的多模态动作数据来帮助机器人训练,同时在投入使用之前可以用来大规模验证各种策略是否有用。进入物理世界。

在这一目标下,业界普遍认为作用于物理世界的具身智能世界模拟器也必须满足一系列标准。例如,必须有纹理细节。有了这些细节,具身智能就可以在语义上区分不同的对象。物体的形状也很重要,因为它会影响机器人如何接触物体,然后规划接触的位置。材料可能会影响具身智能抓住物体的强度。例如,如果表面非常光滑,就必须用很大的力才能防止其滑倒;但如果表面粗糙,可以用轻轻的夹子夹起来。

除了准确模拟纹理、形状、材质之外,张志正提到,具身智能模拟器还必须能够准确模拟机器人与不同材质、形状、纹理的物体交互时环境和物体状态的变化。同时,这些变化必须符合力学和物理定律,这样机器人才能形成准确的交互动作。

相比之下,空很难满足这些条件。人们看到,Sora生成的很多内容缺乏物理正确性,看起来更像是人类梦想的生成,比如一艘巨轮在咖啡杯的海洋中乘风破浪,水杯突然变成了气球以及其他不符合现实世界规律的场景。 。

张志正分析,Sora视频生成模型只是刻画了视频视觉感知的连续性。它不会对行为进行建模,而且维度对于体现智能来说还远远不够。例如,在 Sora 生成的视频中,当一个人去抓一把椅子时,在他的手到达之前椅子就飞了起来。如果用这种场景来训练机器人,可能会导致机器人误认为爪子具有某种重力。

“在做具身智能训练时,甚至需要专门提取出这种不符合物理规律的偏差,以防止它们被注入到具身智能模型中。”张志正说道。

群和科技的黄小黄则从不同的角度看待Sora。他回忆道,十年前他还在上学的时候,在讨论高性能计算应用时,有两个业界最前沿的场景。一是模拟人脑活动或神经网络的研究,二是基于物理世界的模拟渲染。这是计算机理解世界的两种方式。

在前一种路径下,经过多年的发展,ChatGPT利用高性能计算在模拟人脑方面取得了巨大突破。现在Sora也在尝试通过这条路径,通过互联网上的海量视频数据来做自我监督学习和预测。理解物理世界。

群禾科技无疑走的是后一条路。在渲染和还原物理世界的路径下,Group Core基于以往工业级设计软件海量数据解决方案的积累,生成了大量物理正确的空间数据。 “物理上正确”的方面让群合科技比Sora更接近帮助AI落地物理世界。例如,在材质渲染能力方面,Group Core可以渲染现实物理世界中99%的材质,包括大量的有机和无机物质。

目前,业界在如何实现具身智能的技术路径上尚未达成共识。除了模拟路线之外,还有一些技术路线首先利用大型基础模型来学习大量互联网数据视频,以获得大量的人类先验知识。但在这一步之后,机器人仍然需要与真实的物理世界进行交互,或者通过与物理现实相符的数据进行强化学习,才能真正理解物理定律。

可以说,让AI从数字世界走向物理世界,并与物理世界或符合物理世界规则的虚拟环境进行交互,是实现具身智能的重要一步。为此,打造一个开放、标准化、低成本、易于复制的数据平台也是业界的共同愿望。

03

让AI加速进入物理世界

业界已经意识到构建促进机器人训练和加速相关数据流动的应用程序的重要性。

一些公司,比如巨头NVIDIA,正在不断努力开放数据。在今年的 SIGGRAPH 大会上,NVIDIA 发布了适用于 OpenUSD、几何、物理、材料等的生成式 AI 模型和 NIM 微服务。借助 NVIDIANIM 微服务,OpenUSD 这一开源软件平台可用于多个行业的数据交换3D视觉、建筑、设计和制造等技术增强了功能并提高了可访问性,使各行业更容易创建基于物理的虚拟世界和数字孪生。 。

自2018年群禾科技收到硅谷巨头的合作邀请以来,人工智能公司和体现智能公司对机器人训练的数据服务需求不断。

疫情期间是市场需求爆发的重要节点。黄小黄观察到,此前很多机器人训练大多基于企业搭建的物理模拟环境,业内对合成数据存在一些质疑。然而,疫情期间很多工作无法开展,不少机器人企业被迫转向虚拟环境进行模拟培训。

图片

随着越来越多的公司改变训练方式,人们对基于合成虚拟环境的训练机器人有了更多的认识。 “与在单个合成数据和单个物理空间上进行训练相比,物理空间中的训练效果会更好。但如果使用100条合成数据进行训练,其准确性会优于在单个物理空间中的训练效果。”空间。”黄小黄说道。

知名人工智能学者李飞飞上个月发表的论文进一步降低了基于虚拟合成数据的机器人训练门槛。论文指出,在基于虚拟环境训练机器人时,以较低的成本提供更多相似训练场景的分布可以实现更好的跨领域泛化。

市场需求的涌入,也带动群禾科技不断打磨产品。目前,群合智能空间平台已初步向部分企业提供数据集,并已发展成为AIGC、具身智能、AR/VR等企业开放物理正确的3D空间数据资产和空间认知解决方案的庞大平台。

目前,该平台拥有全球最大的室内场景认知深度学习数据集,具备模拟真实室内特征、自动分割标注、场景增强、多平台对接等多项核心能力。例如,模拟真实的室内特性可以赋予模型真实的密度、摩擦力、弹性、阻尼等物理属性信息,还可以对可移动部件施加可移动的物理约束。

自动化分割和标记技术可以根据研究人员的需求定制分割和标记数据,定制不同行业所需的数据集输出。以卧室场景3D数据处理为例,系统可以细分为床、枕头、毯子等基本元素,并生成精准的语义标签。

这些为各种机器人公司创造更智能的产品提供了帮助。此前,一家室内清洁机器人公司非常苦恼。机器人无法识别家庭场景中的动物粪便,清理猫狗粪便后弄得一团糟。过去,为了收集数据,制造商必须组建数十人的团队,耗时数月,并且不得不外包给第三方。整个过程既繁琐又昂贵。

与群禾科技合作后,基于群禾的空间数据能力,在45个工作日内生成了数万组高质量3D模型数据集和数百万组精细化图像数据。数据已交付并可供使用,帮助企业大幅减少数据投资,提高AI项目进度。目前,美的、追米、科沃斯都与群禾科技就空间智能培训相关项目进行了合作。

除了大量企业利用群芯的平台能力外,群芯技术在学术界的空间认知能力也在构建应用生态系统,帮助具身智能开发者加速研究进程。

针对机器人训练中数据采集效率低、场景复用性差、训练风险高、评估难等痛点,群禾科技于2023年联合开发了名为SPEAR的高度物理正确性和视觉真实感的环境数据合成与机器人系统训练模拟平台。

图片

SPEAR依托群合科技庞大的3D模型数据库和先进的渲染技术,构建了一系列具有物理交互特性的高精度虚拟环境。这些虚拟化不仅具有逼真的视觉效果,还保证了物理真实性,为研究人员提供了安全高效的学习和测试空间。开发者可以更轻松地创建多样化的现实模拟场景并快速迭代算法设计。

“信息可以替代浪费的物理资源。”这一论断是密歇根大学迈克尔·格里夫斯教授7年前在《智能制造的虚拟完美模型》中提出的,解释了数字孪生和虚拟世界对物理世界的资源节约价值。 。目前,物理正确的数据正在为实体智能等人工智能在物理世界的加速落地提供帮助。

为了正确反映和影响物理世界,群禾科技走的是与Sora不同的道路。能够走这条路,来自于企业对根技术的投入,根技术就像发动机,不断为企业注入新的可能性。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/272597.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息