这两天我的主页肯定被Sora的各种更新淹没了。
幸运的已经用了,已经开始输出了,但也有不幸的还在排队,比如差评的。
我和大家一样好奇,Sora和我们国产的视频生成应用谁更好?
结果你猜怎么着,外国人比我们还着急。 Sora发布当天,他们就迫不及待地写了一篇评测,并将Sora与HailuoAI进行了比较。
这个海螺AI就是我们所知的海螺AI的海外版,它背后有中国“人工智能六小龙”之一的MiniMax支持。
有一件事要说,这确实让审稿人感到惊讶。
不是我质疑实力,只是没想到空一上线,就有人用海螺AI在竞技场里战斗。这怎么能不算是一种自信呢?
审稿人也去查了一些资料,发现海螺AI在海外确实很受欢迎。
数据显示,自8月底推出视频模型以来,海螺AI在9月、10月的AI产品榜和全球增长榜中均排名第一。
我在X上随便浏览了一下,发现HailuoAI上的讨论非常活跃。时不时会有兄弟在海螺AI上发布自己的杰作。
甚至有人感叹海洛AI可用是因为挤不进Sora。
我不止一次看到欧洲和英国的用户说Sora虽然不能用,但是HailuoAI很好。
千字合成一句话 HailuoAI nb
于是我就有了一个非常大胆的想法。
既然Sora暂时无法使用,我们不妨从海螺AI的角度来看看国内的视频模型能与Sora竞争到什么程度。
正好前几天MiniMax刚刚对它的视频模型进行了一波增强操作,我想我已经迫不及待地想和Sora一起尝试了。
如果还有人不清楚海螺AI的实力,我在这里先给大家预热一下。
这个视频是我从海螺AI官网找到的。图像的质量和连贯性非常出色。视频中的人物和背景基本没有失真、变形或滞后现象。
尤其是当小丑从远到近移动时,人物焦点和背景之间的过渡看起来非常流畅。
当然,我们不能相信所有官方的选择,所以我随机找到了一些路人制作的视频。
我不是在吹牛。海螺AI的视频模型非常擅长生成人物的面部细节,包括肌肉动作、表情甚至情绪,都处理得很好。
不过我也发现,在这段视频中,女子的下巴在最后几秒有点晃动,不仔细看是很难看出的。低头的时候刘海并没有自然垂下来,但是整体的缺陷却没有被掩盖。
这段在走廊里跑步的视频更是让人惊叹。奔跑动作自然流畅,自始至终保持人物的一致性。虽然只有几秒钟,但头发的摆动、光影的变换等所有细节都呈现出来。
关于沙漠中的骷髅怪,没有其他大片了。这张画面的表现力几乎不亚于好莱坞大片。
不管怎样,在看了海螺AI用户所做的任务后,我终于明白为什么Sora出来后,有人立即将两者进行比较。
不用说,海螺AI还是有能力的。
相信大家对于海螺AI的视频模型应该已经有了基本的了解,所以我们就不再废话了,直接尝试一下吧。
一开始,空先使用了雪双塔这一招。
提示:吉隆坡双子塔下着大雪,周围的树上都挂着厚厚的积雪。
画质没得说,看起来像是末日电影的开头。
对于“厚雪”,我也很理解。随着镜头的移动,两侧的树枝完全没有变形,天空飘落的雪花细节饱满。
有大片的枯枝互相重叠,让画面看起来有些杂乱。
而最大的问题是,后面的“双塔”并不是双塔。
塔顶部分的造型看上去更像是广州的腰线,但连接处却是双塔的设计。 。 。在语言理解方面,Sora犯了太基础的错误,这是审稿人没有想到的。
然后将相同的提示输入海螺人工智能,看看海螺人工智能如何响应。
海螺AI在画面稳定性和细节控制方面做得非常好,比如树叶的轻微晃动、树叶的纹理等。
最重要的是海螺AI对提示的理解更加准确。 Sora甚至不知道吉隆坡的双子塔是什么样子。这是一个巨大的扣除。
我们再看一下这个视频。这个提示实际上很抽象。审稿人提取了一些关键词,大概是“超现实主义风格建筑”、“金属银色表面”、“鲜红色光泽的几何图案”、“柔和的散射光”和“光滑”。线条、抛光纹理”
提示:未来派建筑的超现实图像,具有金属银色表面和生动、有光泽的红色几何图案。该结构的流畅线条和抛光纹理在柔和的漫射灯光下得到强调,展现出精致和创新的设计。
这是空交出的答案。
说实话,如果没有看到提示,很难理解这是什么,但一一对比关键词,视频中的元素基本契合在一起,建筑结构确实相当超现实。
相比之下,海螺AI生成的结果更具架构性,该包含的都有。而且,视频中还有基于抛光纹理的反光,基本照顾到了上下对称的细节。
第三局,空拿出了海上风暴。
提示:一场风暴正在阴沉的海洋上空酝酿。波浪黑暗而剧烈(一场风暴正在多云的海洋上酝酿,波浪黑暗而猛烈)
如果你忽略了闪电从头到尾都没有动过,这个视频可能会吓到很多人。
轮到海螺AI了。虽然缺少暴风雨前的气息,但涟漪的明暗变化和海面的起伏却描绘得十分细腻,激起的波浪更有质感。
前三组对比,Sora的视频均来自OpenAI官网。事实上,这对于海螺AI来说并不是特别公平。我们来看看网友们自发的对比。 (这部分视频是差评人手动移动的,画质可能不如原版清晰)
它们也是文字生成的一位老太太脸部特写(具体提示该网友没有分享)。索拉和海螺阿尔都在真实的皮肤纹理上下了功夫,他们的脸并没有因为镜头的移动而变形。
只是在同样的提示下,空表现出了一位西方老太太的表情。
海螺AI生成的这张脸更适合亚洲人的脸型。
当然,人工智能对人类的理解是无可挑剔的。说实话,我觉得这一波可以打平了。
如果非要选一个的话,我个人更喜欢海螺AI的表达方式,比较生动。
我们来看看这组古龙水喝茶的样子。
提示:古龙饮茶
Sora和Conch AI都采用卡通风格。不同的是,空龙用指尖握住茶杯,“喝茶”的动作太奇怪了。他直接低下了头。肉眼可见,头部和茶杯重叠的地方都变形了。 。 。
海螺AI这边的龙完全获胜。
优雅,他拿茶杯的方式像人一样,甚至可以看到龙在茶中颤抖的线条。
总体来说,评测者最大的感受是:Sora的强大是有原因的,但海螺AI也给了我很多惊喜。
但我们今天不必竞争。目的就是想看看Sora是否有那么厉害。对比结果后,我们发现我们并不落后。毕竟海螺AI的视频模型才上线不到半年,就已经可以和Sora媲美了。
而上周,MiniMax推出了新的图胜视频型号I2V-01-Live。新模型创新了二维插画的动态呈现,大大增强了动画的稳定性和细腻表现力。
看看这丝滑的效果,人物更加敏捷了。
不可否认,Sora的产品形态确实领先了一步,视频工作流程的设计思路有国内AI产品借鉴的空间。
不过,海螺AI的路线更多的是先打地基再盖房子。待发电量稳定后,可慢慢建设产品功能。
最重要的是,海螺AI在国内已经可用,普通用户也可以免费体验。这是一个非常物有所值的。
要知道MiniMax的海螺AI无论是技术还是产品能力都是国内顶级的AI产品。现在已经可以和Sora竞争,并且在海外有了一定的分量。
随着多模态技术越来越深入,我认为趋势会更加明显:即使Sora在海外,以MiniMax为代表的国内AI公司也能为国内视频生成开辟一条出路。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273295.html