新模型每周都能见到。Anthropic 在前脚推出了混合推理模型 Claude 3.7 Sonnet,而 OpenAI 立刻打出了 GPT-4.5 这张牌。在当地时间 2 月 27 日,OpenAI 推出了 GPT-4.5,它追随用户意图的能力更加出色,“情商”也更高。OpenAI 的 CEO 山姆·奥特曼把它形容为“是一种别样的智慧”,有着一种他以往从未体会过的魔力。
GPT-4.5 作为一款非推理模型,在预训练进一步扩展后展示出了能力提升,其准确性更高,幻觉更少。值得关注的是,DeepSeek 掀起开源潮和降价潮后,海外市场并未受到影响,此次 GPT-4.5 定价很高,很多人感叹一般人用不起。但从另外一个角度来讲,中国科技企业去开拓海外市场的这种必要性显得更为突出了。
“情商”更高,更懂暗示
据了解,GPT-4.5 在扩展预训练和后训练规模方面迈出了一步。OpenAI 通过扩展无监督学习以及推理这两个互补的范式,来提升人工智能的能力。扩展推理使得模型在做出反应之前能够进行思考,并产生一系列的思维链,这样就能够解决复杂的逻辑问题。无监督学习提升了世界模型的精准度和直觉感受。GPT‑4.5 增强了识别模式的能力,提升了建立联系的能力,并且具备了无需进行推理就能产生创造性见解的能力。
OpenAI 称,相较于 OpenAI o1 和 OpenAI o3‑mini 模型,GPT-4.5 是更为通用且天生更智能的模型。早期的测试显示,与 GPT‑4.5 进行交互会更加自然。GPT‑4.5 凭借其更广泛的知识基础、更强的追随用户意图的能力以及更高的“情商”,在提升写作、编程以及解决实际问题等任务方面能发挥效用。GPT‑4.5 能够更好地理解人类的意思,它能够以更细微的差别和“情商”去解释那些微妙的暗示,也能够解释那些隐含的期望。
快思慢想研究院院长田丰曾担任原商汤智能产业研究院创始院长。他表示,GPT - 4.5 的推出,验证了美国大模型遵循“大力出奇迹”的尺度定律路线。其算力、数据、模型皆为顶级配置,通过使用更大的算力和更多的数据,训练出效果更优的模型。并且,GPT - 4.5 的预训练阶段算力极为庞大,使用了 10 倍的算力来进行训练。
“神仙”按月打架,重视技术储备
今年大模型会呈现出相互竞争、你追我赶的态势。OpenAI 当下所采取的策略犹如“领先半步”一般。田丰做出了这样的表述。
在 GPT - 4.5 推出之前,OpenAI 内部在进行着至少两个模型版本的迭代工作。其中包括针对 GPT - 4.5 进行测试,对其进行工程优化,以及使其产品化并进行对齐等操作。同时,OpenAI 拥有资金、人力和算力来进行双版本的储备,其他公司若要跟上节奏,也必须做到这一点。他表示,在当前竞争周期变得越来越长的情形下。国外的 Anthropic 需要有更多技术储备投入,国内的 DeepSeek 也需要有更多技术储备投入。
头部大模型公司会按季度来更新模型版本,最慢需要 100 天,要是快的话 30 天就能完成。现在“神仙打架”已经变成按月进行了,一个季度就如同一场巡回赛。田丰表示,如果跟不上这样的节奏,就需要在产业链上找到自身的优势。大模型厂家如果不能每 1 到 2 个月推出一个新版本,或许会憋大招,憋上 3 到 5 个月,然后憋出一个好版本,从而追上现在的大模型,这也是有可能的。
他认为,当前最值得关注的国外大模型有 OpenAI 的 GPT-4.5 。他认为,当前最值得关注的国外大模型有 Anthropic 的 Claude 3.5 。他认为,当前最值得关注的国外大模型有马斯克旗下 AI 公司 xAI 的 Grok 3 。他认为,尤其三者间的逻辑推理能力对比更有价值。Anthropic 日前推出了混合推理模型 Claude 3.7 Sonnet,此模型具有“系统一”和“系统二”两套系统。它既能够快速回应用户的问题,又能够针对复杂问题启动“系统二”进行深度思考,思考时间会比快速回答问题时更长,就如同人类一样。从这个角度去看,Claude 3.7 Sonnet 在架构的双系统层面具备一定的领先态势以及能带来启发。当数据和算力遭遇瓶颈之时,它会将创新重点集中在模型架构这一层面,去探索方法方面的创新、工程化方面的创新以及架构上的创新。
田丰称,GPT-4.5 这类模型会加快对基础模型通用知识领域的补充,提升复杂推理的质量以及对情绪的感知能力。基础模型主要承担高水平的通用能力,而 AI 应用则负责行业的逻辑。Grok3 会在空间智能领域投入力量,促使具身智能体的“GPT 时刻”更快到来。垂直领域的专业模型也会成为中国大模型的竞争之地,中国在机器人的产量以及使用规模上更具优势。
庞大但昂贵
山姆·奥特曼在对 GPT4.5 的性能给予高度评价的同时,还表示这是一个模型,且这个模型“庞大且昂贵”。
据悉,GPT-4.5 的 API 调用,其输入价格是 75 美元每百万 token,输出价格是 150 美元每百万 token。这不仅比 GPT 以往的模型价格高,也比市场上其他模型的价格高。以 Claude 3.7 为例,调用它的 API 时,输入百万 token 的收费是 3 美元,输出的收费是 15 美元。
DeepSeek-V3 最近推出了错峰优惠政策。在凌晨时段,调用其 API 输入百万 token 只需 0.25 元。非优惠时段调用其 API 输入百万 token 也不过 0.5 元。输出百万 token 的优惠价格是 4 元,标准时段价格为 8 元,且定价均为人民币。与国内模型相比,它在价格上有一定优势。
业内人士认为,OpenAI 的定价如此之贵。其一,其算力成本确实很高。其二,海外市场和国内市场的定价策略遵循不同逻辑,即便如此,OpenAI 仍能凭借技术优势获得更高溢价。
田丰称,OpenAI 当前遭遇 GPU 供应不足的难题。GPT‑4.5 的推理成本较高,算力开支较大,这使得用户使用成本高昂,难以在全民范围内进行推广和使用。
OpenAI 的 CEO 山姆·奥特曼在社交媒体上明确表示,他们非常希望能够同时为 Pro 用户和 Plus 用户推出相关服务,然而他们的发展速度非常快,导致 GPU 已经用完了。他们将会在下周增加数以万计的 GPU,然后向 Plus 用户推出服务。GPT Pro 的月费为 200 美元。GPT‑4.5 当前不具备 GPT 中的屏幕共享功能。
Hugging Face 的工程师王铁震觉得,OpenAI 的定价策略没被 DeepSeek“卷”到,原因在于国内市场与海外市场原本就有着不同的定价策略。还有大模型从业人士认为,OpenAI 依旧遵循着“高服务定价 - 高企业估值”的业务逻辑,即“追求技术领先一步,接着享受技术带来的溢价”。
田丰觉得,与美国企业的那种“大力出奇迹”相比,国内当下的大模型路线是通过极致的性价比来达成更优的模型效果。两边的发展会逐渐变得越来越不同,不过最终都会被拉到同一个竞技场上进行比拼。
王铁震认为,国内市场在各个行业都存在“卷价格”的现象。与之相比,海外市场的利润更高,且能接受技术带来的溢价。这是近年来中国企业纷纷出海的一个重要动力。然而,中国大模型企业若想进入海外市场,将会面临与中国电动车等其他行业出海相同的挑战,这些挑战不仅仅涉及价格、技术和性能。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/274615.html