1. 首页>>分享

DeepSeek-V3模型升级:数学解题、代码生成、报告撰写能力全面提升

3 月 25 日晚,DeepSeek 官方公众号发布消息。DeepSeekV3 模型已完成小版本的升级,当前版本号为 DeepSeek-V3-0324。用户登录官方网页、APP 或小程序进入对话界面后,只需关闭深度思考便可进行体验。API 接口以及使用方式均保持不变。

DeepSeek 表示,本次升级包含了数学解题这一核心场景,也涵盖了代码生成以及报告撰写等核心场景。API 接口无需进行改动就能够适配,新版的 V3 模型在推理能力方面超越了 GPT - 4.5,其前端代码的设计感达到了满值,同时中文写作的质量实现了飞跃式的提升。

全文如下:

DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek V3 模型完成了小版本的升级,当前版本号为 DeepSeek-V3-0324。用户登录官方的网页、APP 或者小程序,进入对话界面后,只要关闭深度思考就能够进行体验。并且 API 接口以及使用方式都没有发生改变。

如果不是复杂推理任务,那么建议使用新版本 V3 模型,这样就能即刻享受到速度更加流畅且效果全面提升的对话体验。

模型能力提升一览

1、推理任务表现提高

新版 V3 模型参考了 DeepSeek-R1 模型训练过程中运用的强化学习技术,使得在推理类任务上的表现水平有了很大提升,并且在数学、代码类相关评测集上获得的得分成绩超过了 GPT-4.5。

图片

新版 V3 模型在百科知识方面(如 MMLU-Pro、GPQA)的表现有提升;在数学方面(如 MATH-500、AIME 2024)的表现有提升;在代码任务(如 LiveCodeBench)方面的表现有提升。

2、前端开发能力增强

新版 V3 模型在 HTML 等代码前端任务方面生成的代码可用性更高。同时,其视觉效果更加美观,富有设计感。

图片

动图展示了一个 p5.js 程序,该程序由模型生成,用于演示多个小球在指定空间范围内的运动。程序中包含若干滑动按钮,这些按钮可以用来调整重力、摩擦力等参数。并且,程序是以赛博朋克风格的 HTML 呈现的。

3、中文写作升级

新版 V3 模型在中文写作任务上,是基于 R1 的写作水平进行了进一步的优化。并且,它特别提升了中长篇文本创作的内容质量。

图片

图片

4、中文搜索能力优化

新版 V3 模型在联网搜索场景下,对于报告生成类指令,能输出更详实准确的内容,排版也更清晰美观。

图片

新版 V3 模型在问答闲聊方面得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 和之前的 DeepSeek-V3 采用相同的 base 模型,只是对后训练方法进行了改进。在进行私有化部署时,只需更新 checkpoint 和 tokenizer_config.json(其中包含 tool calls 相关的变动)。模型的参数大概是 660B,开源版本的上下文长度是 128K,在网页端、App 和 API 中提供的上下文长度是 64K。V3-0324 模型权重的下载请参考:

Model Scope:

Huggingface:

此次我们的开源仓库(包含模型权重)与 DeepSeek-R1 保持一致,都统一采用 MIT License。并且用户可以利用模型输出,还可以通过模型蒸馏等方式来训练其他模型。

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://mjgaz.cn/fenxiang/275142.html

联系我们

在线咨询:点击这里给我发消息

微信号:13588888888

工作日:9:30-18:30,节假日休息