李飞飞教授创办的公司Word Labs推出了其第一个重大成果——世界生成:一种从单个图像生成3D物理世界的人工智能系统。主要特点是你可以输入任何图像并进行3D探索,就像“任意”穿越时空的“门”一样,感觉太神奇了。这是人工智能迈向空间智能的第一步。
斯坦福大学李飞飞教授刚刚宣布,她领导的World Labs团队推出了一款AI系统,可以从单张图片生成3D世界!不是简单的3D建模,而是真正的交互式3D物理场景!
3D场景可以在浏览器中实时渲染,并且可以通过WASD键和鼠标自由控制视角,就像玩游戏一样!太酷了!
用户甚至可以体验3D相机效果,例如模拟浅景深,只有距相机一定距离的物体才能对焦
或“移动变焦”
您可以到这里体验网页
世界实验室试图解决什么问题?
当前生成式人工智能模型的最大问题是缺乏控制和一致性。世界实验室旨在解决这个问题!他们的人工智能系统可以首先根据输入图像估计 3D 几何形状,然后填充场景中不可见的部分。它还可以根据3D几何信息创建新的内容,使场景更加完整!这将改变电影、游戏、模拟器和其他物理世界数字表示的制作方式
预测 3D 场景,而不是预测像素
大多数生成模型都会预测像素,而预测 3D 场景有很多好处:
持久的现实:世界一旦被创造,它将永远存在。即使你移开视线,当你回头时,场景也不会改变。它不会像某些AI模型那样当你改变角度时“变脸”。
实时控制:生成场景后,您可以实时在场景中移动。您可以停留在花朵的细节上,也可以从角落里偷看,看看里面有什么
正确的几何形状:生成的世界遵循 3D 几何的基本物理规则。它们具有实质感和深度感,与某些人工智能生成视频的梦幻性质形成鲜明对比
可视化方法:World Labs 的系统生成 3D 场景的方式称为深度图,其中每个像素的颜色代表其与相机的距离。
交互性:您可以修改场景的照明、外观和几何形状
还可以创建特殊效果来被动地动画场景
走进世界名画
世界一代让您以新的方式体验标志性的艺术作品。例如梵高、霍珀、修拉和康定斯基都可以在wordlab网页上体验
您可以到这里体验网页
与其他人工智能工具无缝集成!
World Labs的3D场景生成技术可以与其他AI工具结合使用,让创作者的工作流程更加高效!
例如,您可以通过首先使用文本到图像模型生成图像来从文本创建一个世界。不同的模型有自己的风格,worldlab技术可以继承这些风格。
在这里,我们使用四种流行的 text2image 模型 FLUX、Midjourney、Ideogram 和 DALL-E,并使用相同的提示生成同一场景的四种变体。
这里的体验:
目前,Wordlab已经让一些创作者提前了解了这项技术,并开始尝试3D原生生成AI工作流程带来的可能性。
数字艺术家@8bit_e利用World Labs的技术,轻松地将角色放置在场景中并进行精确的镜头运动控制,填补了他创作过程中的空白,大大提高了创作效率!
未来展望
NVIDIA JIM FAN 评论:
生成式人工智能正在创建越来越高维度的人类体验快照
稳定扩散是二维快照
OpenAI Sora是二维快照加时间维度
现在,世界实验室是一个三维的、完全身临其境的快照
总的来说,World Labs的3D世界生成技术绝对是AI领域的重大突破!将为游戏、电影、艺术等领域带来无限可能!
李飞飞教授表示,这只是3D生成式AI的开始!他们正在努力让这项技术早日到达用户手中!
候补名单注册地址:
或者直接联系他们:hello@worldlabs.ai
参考:
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/272988.html