今年2月首次亮相时震惊科技界的OpenAI超级视频模型Sora终于与公众见面了。这是OpenAI连续12个交易日新产品或新技术发布活动的又一亮点。
美国东部时间 12 月 9 日星期一,OpenAI 在社交媒体上宣布将为大家带来一份节日礼物 Sora,称它可以根据文本生成新视频,并使图像变得栩栩如生。它还可用于扩展、重新混合、编辑或融合视频。现有视频。
OpenAI 表示,自 2 月份预览 Sora 以来,它一直在构建 Sora Turbo,这是该模型的一个明显更快的版本,并于周一将其作为独立产品推出给 ChatGPT Plus 和 ChatGPT Pro 用户。
替换、删除或添加元素、重新剪切、扩展和合并功能
Wall Street Insights在2月份介绍OpenAI的大招Sora时指出,Sora结合了扩散模型(DALL-E3)和转换器架构(ChatGPT)。通过这种组合,模型可以像 ChatGPT 处理文本一样处理视频(即图像帧的时间序列)。
最令人印象深刻的功能是 Sora 能够真实地模拟物理世界,OpenAI 将其称为“新兴模拟功能”。在此之前,还没有可以与此相媲美的文字视频模式。
例如,Sora“可以在一个生成的视频中创建多个镜头,准确地代表角色和视觉风格。”它可以创建长达1分钟的视频,但用户也可以创建任意长度的短视频。可以制作不同分辨率的垂直、方形和水平视频。计算量越高,视频质量就越高。
有评论称,周一推出的Sora与OpenArt的AI工具DALL-E类似。用户输入想要的场景,Sora就会反馈高清视频编辑结果。
本周一OpenAI官网的Sora页面介绍了Sora的一些功能。其中,名为Remix的混音功能可以替换、删除或重新想象视频中的元素。例如,在设计门向图书馆开的场景时,用户可以将普通门替换为法式门,图书馆就可以转变为场景。进入宇宙飞船,然后你可以移除宇宙飞船,添加丛林,并用月球景观替换丛林。
Sora的重新编辑功能Re-cut可以找到并隔离视频中的最佳帧,将帧向任一方向延伸以完成场景。称为故事板的故事板功能允许您在个人时间线上组织和编辑独特的视频序列。称为循环的循环编辑功能可用于创建图像无缝重复的视频。称为 Blend 的混合功能可以将两个视频无缝合并为一个编辑后的视频。用户可以使用称为“样式预设”的样式预设功能来创建和共享激发个人想象力的样式。
包含在 ChatGPT Plus 和 Pro 包中
定价方面,Sora目前包含在OpenAI的两个产品包中。其中,ChatGPT Plus每月收费20美元,为订阅者生成分辨率高达720p、最长持续时间为5秒的视频。 ChatGPT Pro 订阅者每月费用为 200 美元。可以生成无限的高分辨率视频,分辨率高达 1080p,最长持续时间为 20 秒。可同时生成5个视频,并且视频可无水印下载。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273126.html