4月13日消息：谷歌计划融合Gemini AI与Veo视频生成模型提升对物理世界理解能力-模具钢网

4 月 13 日消息，IT 之家获悉，谷歌 DeepMind 的首席执行官 Demis Hassabis 在一档播客节目 Possible 中进行了透露。这档播客节目是由领英的联合创始人 Reid Hoffman 共同主持的。谷歌计划将旗下的 Gemini AI 模型与 Veo 视频生成模型进行融合，其目的是提升 Gemini 对物理世界的理解能力。

谷歌智能助手下载_你认识谷歌助手吗_

Hassabis 表示：我们从起始阶段就把 Gemini 这个基础模型构建成多模态模型。因为我们怀有构建一个通用数字助手的愿景，这个数字助手能够在真实的世界里切实地为你提供帮助。

目前，整个 AI 行业正逐步往“全能”模型的方向前行。这些模型具备理解多种媒体形式并进行整合的能力。谷歌最新的 Gemini 模型不但能够生成图像和文本，而且还可以生成音频。OpenAI 在 GPT 中的默认模型现在也能够创建图像，其中包括宫崎骏风格的艺术作品。亚马逊宣布计划在今年晚些时候推出一种模型，这种模型可以实现“任意到任意”。

据 IT 之家所知，这些“全能”模型需大量训练数据，包含图像、视频、音频、文本等。Hassabis 表明，Veo 的视频数据主要是从谷歌旗下的 YouTube 平台得来的。他称：“凭借观看众多的 YouTube 视频，Veo 2 可以知晓世界的物理规律。”此前，谷歌向 TechCrunch 表明，其模型或许会依据与 YouTube 创作者所达成的协议，运用“部分”YouTube 内容来进行训练。据悉，该公司在去年对服务条款的部分内容进行了扩大，目的是获取更多数据以训练其 AI 模型。

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://mjgaz.cn/fenxiang/275433.html

4月13日消息：谷歌计划融合Gemini AI与Veo视频生成模型提升对物理世界理解能力

相关推荐

联系我们