1. 首页>>分享

深度求索发布DeepSeek-V3模型,性能显著提升并同步开源

12月26日晚,杭州DeepSeek人工智能基础技术研究有限公司(以下简称“DeepSeek”)宣布,新系列模型DeepSeek-V3首个版本上线并同步开源

Deep Search显示,DeepSeek-V3在知识任务(MMLU、MMLU-Pro、GPQA、SimpleQA)方面的水平相比上一代DeepSeek-V2.5有了显着提升,并且接近目前发布的表现最好的模型由人类十月。克劳德-3.5-十四行诗-1022。在美国数学竞赛(AIME 2024,MATH)和全国高中数学联赛(CNMO 2024)中,DeepSeek-V3 显着超越了所有其他开源和闭源模型。此外,在生成速度方面,DeepSeek-V3的生成和铰接速度从20TPS(每秒事务数)大幅提升至60TPS。与V2.5机型相比,实现了3倍的提升,能够带来更流畅的使用体验。

拼多多大班模型吧_拼多多aarrr模型_

DeepSeek-V3与其他模型的比较。图片来源:Deep Seek微信公众号

Meta AI研究科学家田元东对DeepSeek-V3在各个方向上的进展表示赞赏,称“这是一项令人惊叹的工作”。

根据官方技术论文,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。深搜表示,“这是一个全新的开始”。

公开资料显示,深搜由知名量化资产管理巨头欢放量化于2023年7月17日创立。还方量化创始人梁文峰在量化投资和高性能计算领域拥有深厚的背景和丰富的经验。成立半年后,第一代大模型DeepSeek Coder发布; 2024年5月,发布第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2。 DeepSeek V2模型因其在汉语综合水平评估中的出色表现以及极低的推理成本而被称为“AI界的拼多多”,引起了业界的关注。 DeepSeek-V3模型API服务的定价为每百万个输入令牌0.5元(缓存命中)/2元(缓存未命中),每百万个输出令牌8元,并享受45天的优惠价格试用期。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/273708.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息