西风从奥飞寺吹来
量子比特 |公众号QbitAI
Gemini 2.0一键造图的能力人气爆棚,让不会玩的人都羡慕哭了!
以小型车为例:
输入命令“把这辆车改装成敞篷车”,它会立即将文字命令与图片结合起来,完成一键P图。
我们找一下差异,发现除了车变成了敞篷车之外,其他元素都没有改变,保持了很好的一致性。
不仅如此,Gemini 2.0还有“多模版o1”的味道。
继续输入:想象这辆车装满了海滩用品。接下来,将身体颜色更改为让人想起夏天的颜色,并随时解释这一变化。
然后Gemini 2.0开始用图文生成逐步推理。它先把车变成亮黄色,然后在车里装满沙滩伞和其他海滩用品。
这是Gemini 2.0系列原生的图像输出能力。
评论区下,大家都在询问具体的上线时间:
被谷歌挖走的 OpenAI 将军 Logan Kilpatrick 表示,不用担心,明年初大家都会更广泛地推出。
各种P图就是一句话的事情
除了上面展示的简单P图之外,你甚至可以同时P出图片中的多个元素,还可以将一个物体变成另一个物体。
例如,将你的蓬松夹克变成一个小枕头并取下毯子:
这还没完,你还可以将不同的图片组合起来P。
将猫和枕头结合起来,你会得到一个非常有质感的猫枕头:
将猫和滑板结合起来会导致猫认可滑板。
按照文字说明,Gemini 2.0成功将猫变成了插画贴纸形式。
另外,Gemini 2.0 P绘图可以更加富有想象力。
比如打开一个盒子,它就会变成姜子儿:
开头展示的小车也可以变身为“飞行汽车”:
除此之外,还有一种玩法。
圈出图像中需要P的区域,只需“打开这个”,Gemini 2.0就可以结合文字指令直接看懂图像,并知道“这个”的指代:
不得不说,那些获得内测资格的玩家,真是让大家都眼红了。
参考链接:
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273359.html