视频一致性的突破
Sora一经推出,便引起大批视频创作者跃跃欲试。
一位专业视频博主在体验了Sora正式版后得出的结论是,Sora无论是在用户体验的完整性,还是视频修改编辑的丰富性方面都非常强大。动作效果非常流畅,分镜视频的一致性也很好。这是“完美”的。
记者注意到,OpenAI在直播和官网上详细介绍了Sora的几个核心功能,包括Remix、Re-cut、Storyboard、Loop和Blend。和风格预设(风格预设)。
故事板是 Sora 的一大亮点功能,允许用户通过带有关键帧的时间轴在个人时间轴上组织和编辑独特的视频序列。该功能为创作者提供了更大的创作空间,让视频内容的规划和调整更加灵活。
混音功能使用户能够替换、删除或重新想象视频中的元素,从而使用户可以更自由地塑造最终效果。例如,在官网的演示视频中,用户可以将设计的“打开图书馆的门”场景中的普通门替换为法式门,将图书馆变成一艘宇宙飞船,甚至可以轻松移除宇宙。飞船被替换为丛林,最后丛林被替换为月球景观,创造出创意多样的视频效果。
重新剪切功能允许用户通过查找视频中的最佳帧并将其向任意方向扩展来微调视频内容。循环通过在开头和结尾添加额外的帧来连接视频剪辑,创建看起来像平滑循环的无缝重复视频。混合允许用户将两个完全不同的视频混合成一个无缝剪辑,从而创建和谐的过渡。
风格预设使用户可以根据自己的创意选择或定制不同的风格,实现快速创作。例如,用户可以将两只猛犸象在雪中行走的场景转换为纸工艺风格。
一位体验者分享说,Sora正式版的功能比他想象的要多。尤其是Remix、Blend、Loop等功能让他感觉耳目一新,而其中Storyboard功能最为令人印象深刻。
在此前的采访中,余国汉指出,在商业AI视频制作中,画面一致性、分辨率和语义理解是决定视频质量的关键因素。
尽管Vincent Video技术为创意工作开辟了新的空间,但其现有的局限性使其在商业应用中的价值远不如Tusen Video。目前,文森特视频的大型模型大多像发烧友的“玩具”,无法满足商业需求。因为在短剧的制作中,需要保证人物等元素的一致性,而文森特视频往往只能生成几秒钟的内容,而下一秒内容可能会发生变化,这显然不能满足要求的专业生产。 。
李伯杰此前也提到,在技术层面,文森视频面临的关键挑战之一是风格一致性问题。例如,生成10秒视频时,人物图像是否一致,前后视频中人物的外观是否不一致。此外,视频中的物理规律是否符合常识也是一个难点。
此次发布的Sora正式版得到了体验者的一致好评:通过不同的提示,Sora可以生成几乎完美一致的故事板,从而形成流畅的视频。其Storyboard功能尤其出色,能够通过时间线中的Storyboard帧来引导每个场景的内容,保证镜头一致性,并支持可控镜头切换和多动作引导。
视频版本GPT-1
虽有不足但仍遥遥领先
余国汉在接受《IT时报》记者采访时表示,虽然他还没有亲自体验过Sora,但从目前与其他创作者的交流来看,Sora已经明显超越了之前的文胜视频工具,展示了更强大的功能。他直言:“贵是真贵,强是真强。”
他进一步指出,腾讯不久前开源了混元模式。大家都认为现在的开源技术已经接近闭源的水平了。不过,Sora的推出表明闭源技术仍然领先一代,展现出更强的实力和潜力。
另一方面,根据试用用户的反馈,如果说Sora制作文字视频的能力褒贬不一,那么它在绘制视频方面的表现则不尽如人意。余国汉透露,在与同行的交流中,Sora的图像生成视频功能正式版受到了很多批评:“大家对Sora的图像生成视频性能感到惊讶,认为其效果很差。”
国外科技博主Marques Brownlee在经过一周的评测后也表示,Sora存在一些缺点,比如对物理定律的理解不够好,仍然会出现人手不自然、文字乱码、动物奔跑时飞翔的情况,等条件。
此外,OpenAI还开发了新的UI并提供社区共享服务,允许用户分享自己生成的视频或学习其他人的提示效果来改进自己的作品。
奥特曼在X(推特)上发帖称,最令他兴奋的是与其他人共同创作的便利性。感觉这是一个有趣的新事物。你可以将 Sora 视为 GPT-1 的视频版本。
随着Sora正式版的发布,文圣视频领域将再次“变”。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273203.html