1. 首页>>分享

4月13日消息:谷歌计划融合Gemini AI与Veo视频生成模型提升对物理世界理解能力

4 月 13 日消息,IT 之家获悉,谷歌 DeepMind 的首席执行官 Demis Hassabis 在一档播客节目 Possible 中进行了透露。这档播客节目是由领英的联合创始人 Reid Hoffman 共同主持的。谷歌计划将旗下的 Gemini AI 模型与 Veo 视频生成模型进行融合,其目的是提升 Gemini 对物理世界的理解能力。

谷歌智能助手下载_你认识谷歌助手吗_

Hassabis 表示:我们从起始阶段就把 Gemini 这个基础模型构建成多模态模型。因为我们怀有构建一个通用数字助手的愿景,这个数字助手能够在真实的世界里切实地为你提供帮助。

目前,整个 AI 行业正逐步往“全能”模型的方向前行。这些模型具备理解多种媒体形式并进行整合的能力。谷歌最新的 Gemini 模型不但能够生成图像和文本,而且还可以生成音频。OpenAI 在 GPT 中的默认模型现在也能够创建图像,其中包括宫崎骏风格的艺术作品。亚马逊宣布计划在今年晚些时候推出一种模型,这种模型可以实现“任意到任意”。

据 IT 之家所知,这些“全能”模型需大量训练数据,包含图像、视频、音频、文本等。Hassabis 表明,Veo 的视频数据主要是从谷歌旗下的 YouTube 平台得来的。他称:“凭借观看众多的 YouTube 视频,Veo 2 可以知晓世界的物理规律。”此前,谷歌向 TechCrunch 表明,其模型或许会依据与 YouTube 创作者所达成的协议,运用“部分”YouTube 内容来进行训练。据悉,该公司在去年对服务条款的部分内容进行了扩大,目的是获取更多数据以训练其 AI 模型。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275433.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息