3 月 26 日有消息称,聊天机器人生来的用途仅仅是聊天,然而现在它却进化出了画图的能力。在当地时间的周二,美国的人工智能公司 OpenAI 为 GPT 聊天机器人进行了全新技术的升级,让它能够依据详细、复杂甚至很不寻常的指令来生成图像。
如果用户将一幅四宫格漫画描述出来,把每一格中出现的角色以及他们之间的对话都详细说明,那么这种技术就能够立刻生成一幅精心设计的卡通图像。
之前版本的 GPT 能够生成图像,不过在整合如此多样的概念以进行图像创作方面,它无法做到可靠。
新版 GPT 发布了,这标志着人工智能技术正在经历更广泛的变革。聊天机器人起初是纯文本生成系统,之后逐步转变为将聊天与多种能力整合在一起的工具。
支撑新版 GPT 的技术 GPT - 4o 具备这样的能力,它能让聊天机器人接收语音命令,能让聊天机器人响应语音命令,能让聊天机器人接收图像,能让聊天机器人响应图像,能让聊天机器人接收视频,能让聊天机器人响应视频,甚至还可以实现语音对话。
2022 年底发布了初代 GPT,它通过分析大量的互联网文本数据,学会了回答问题、创作诗歌以及编写代码。大约过了一年,OpenAI 推出了具备生成图像功能的 DALL-E 系统,并且该系统与 GPT 是相互独立的。
如今 OpenAI 打造出了一个统一的系统,它能够通过同时对文本和图像数据进行学习,从而掌握多种技能。在生成图像的过程中,这个系统可以调用 GPT 从互联网中学到的所有知识。
OpenAI 研究员加布里埃尔·吴称,这从本质上来说是一种全新的底层技术。我们并非将图像生成与文本生成分开进行处理,而是在追求两者的协同运作。
传统人工智能图像生成器一般难以生成与现有图像有显著差异的新内容。比如,当用户让图像生成器创作一幅带有三角形车轮的自行车图像时,旧的系统常常难以做到。
吴表示,新版GPT已经能够处理这种需求。
OpenAI 宣告,从本周二起,新版 GPT 会同时向免费用户和付费用户开放。其中包含每月 20 美元的 GPT Plus 以及每月 200 美元的 GPT Pro 服务,并且 GPT Pro 服务能给予用户使用公司所有最新工具的权限。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275141.html