DeepSeek-V3模型升级：数学解题、代码生成、报告撰写能力全面提升-模具钢网

3 月 25 日晚，DeepSeek 官方公众号发布消息。DeepSeekV3 模型已完成小版本的升级，当前版本号为 DeepSeek-V3-0324。用户登录官方网页、APP 或小程序进入对话界面后，只需关闭深度思考便可进行体验。API 接口以及使用方式均保持不变。

DeepSeek 表示，本次升级包含了数学解题这一核心场景，也涵盖了代码生成以及报告撰写等核心场景。API 接口无需进行改动就能够适配，新版的 V3 模型在推理能力方面超越了 GPT - 4.5，其前端代码的设计感达到了满值，同时中文写作的质量实现了飞跃式的提升。

全文如下：

DeepSeek-V3 模型更新，各项能力全面进阶

DeepSeek V3 模型完成了小版本的升级，当前版本号为 DeepSeek-V3-0324。用户登录官方的网页、APP 或者小程序，进入对话界面后，只要关闭深度思考就能够进行体验。并且 API 接口以及使用方式都没有发生改变。

如果不是复杂推理任务，那么建议使用新版本 V3 模型，这样就能即刻享受到速度更加流畅且效果全面提升的对话体验。

模型能力提升一览

1、推理任务表现提高

新版 V3 模型参考了 DeepSeek-R1 模型训练过程中运用的强化学习技术，使得在推理类任务上的表现水平有了很大提升，并且在数学、代码类相关评测集上获得的得分成绩超过了 GPT-4.5。

新版 V3 模型在百科知识方面（如 MMLU-Pro、GPQA）的表现有提升；在数学方面（如 MATH-500、AIME 2024）的表现有提升；在代码任务（如 LiveCodeBench）方面的表现有提升。

2、前端开发能力增强

新版 V3 模型在 HTML 等代码前端任务方面生成的代码可用性更高。同时，其视觉效果更加美观，富有设计感。

动图展示了一个 p5.js 程序，该程序由模型生成，用于演示多个小球在指定空间范围内的运动。程序中包含若干滑动按钮，这些按钮可以用来调整重力、摩擦力等参数。并且，程序是以赛博朋克风格的 HTML 呈现的。

3、中文写作升级

新版 V3 模型在中文写作任务上，是基于 R1 的写作水平进行了进一步的优化。并且，它特别提升了中长篇文本创作的内容质量。

4、中文搜索能力优化

新版 V3 模型在联网搜索场景下，对于报告生成类指令，能输出更详实准确的内容，排版也更清晰美观。

新版 V3 模型在问答闲聊方面得到了一定幅度的能力提升。

模型开源

DeepSeek-V3-0324 和之前的 DeepSeek-V3 采用相同的 base 模型，只是对后训练方法进行了改进。在进行私有化部署时，只需更新 checkpoint 和 tokenizer_config.json（其中包含 tool calls 相关的变动）。模型的参数大概是 660B，开源版本的上下文长度是 128K，在网页端、App 和 API 中提供的上下文长度是 64K。V3-0324 模型权重的下载请参考：

Model Scope:

Huggingface:

此次我们的开源仓库（包含模型权重）与 DeepSeek-R1 保持一致，都统一采用 MIT License。并且用户可以利用模型输出，还可以通过模型蒸馏等方式来训练其他模型。

本文采摘于网络，不代表本站立场，转载联系作者并注明出处：http://mjgaz.cn/fenxiang/275142.html

DeepSeek-V3模型升级：数学解题、代码生成、报告撰写能力全面提升

相关推荐

联系我们