3 月 26 日有消息称,在今日深夜的时候,谷歌推出了全新的模型 Gemini 2.5 Pro。谷歌宣称,这个模型是“世界上最为强大的模型”,拥有统一的推理能力,并且集成了长上下文理解以及工具调用等多项功能。
Gemini 2.5 Pro 也是一种推理模型。此模型目前已在 Google AI Studio 和 Gemini 应用中,并且面向 Gemini Advanced 用户开放。谷歌称,定价方案将在接下来的几周内进行公布。
Gemini 2.5 Pro 在多个基准测试里达到了 SOTA(当前最优)的水平。在 LMArena 排行榜方面,Gemini 2.5 Pro 凭借创纪录的优势获取了第一名。它比 Grok - 3 以及 GPT - 4.5 要高出整整 40 分,创造了历史上最大的分数飞跃。
在“nebula”测试里,Gemini 2.5 Pro 把所有类别都横扫了。它在数学领域夺冠,在创意写作领域夺冠,在指令遵循领域夺冠,在长查询领域夺冠,在多轮对话领域夺冠。并且,它在困难提示词领域与 Grok - 3 和 GPT - 4.5 并列第一,在编程领域也与它们并列第一。
Gemini 2.5 Pro 登上了视觉竞技场(Vision Arena)的排行榜榜首。在网页开发竞技场(WebDev Arena)里,Gemini 2.5 Pro 表现良好,取得了亚军的成绩,并且成为首个实力与 Claude 3.5 Sonnet 相近的模型。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275184.html