DeepSeek的一次小更新堪比发布新模型

更新时间：2025-03-26 21:12:11 发布时间：11小时前浏览：880 评论：0

内容摘要一个好消息，时隔俩月， DeepSeek 终于更新了。就在昨天晚上， DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。模型参数 6850 亿，跟上一个版本的 V3 （ 6710 亿

一个好消息，时隔俩月， DeepSeek 终于更新了。

就在昨天晚上， DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。

模型参数 6850 亿，跟上一个版本的 V3 （ 6710 亿）相差不大，采用 MoE 架构，还支持了更开放的 MIT 开源协议。

根据官方更新的版本说明， DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强，写作风格实现了跟 R1 对齐，另外还有一些其他方面的小优化。

现在打开 DeepSeek 官网，把深度思考模式关掉就能直接用上 V3-0324 。

不过有一说一，虽然 V3-0324 仅仅只是 V3 的小版本升级，并不是大伙儿期待已久的 V4 或者 R2 ，且官方账号也没有发布任何跟模型有关的信息。

但也丝毫不妨碍， V3-0324 一上线，就有人说他的代码能力，直追克劳德。

新版本的模型刚一上传，就登上了 Hugging Face 的趋势榜单。

在国外大模型竞技场 KCORES 的测评中， V3-0324 的代码能力得分 328.3 ，超过了普通版的 Claude 3.7 Sonnet 的 322.3 分，接近 Claude 3.7 Sonnet 思维链版本的 334.8 分，排名第三。

图源 @karminski 牙医

重点是，排名在前面的模型压根就没几个开源免费的， V3-0324 可谓是一枝独秀。

所以在 V3-0324 上线不到一天的时间里，就已经有很多老哥迫不及待上手测评了一波。

这么说吧， V3-0324 在这些人手里，已经成了拳打 o3-mini ，脚踢 Claude 3.7 Sonnet 的存在。

经典的小球弹跳测试中，这位老哥把 V3-0324 、 o3-mini 和 R1 拉了个横评。

o3-mini 刚开始看着还不赖，但估计物理没学好，外面的六边形都转到垂直的位置了，球还不知道往下掉。

R1 的表现，也是有些让人摸不着头脑。。

相对来说， V3-0324 生成的结果是表现最好的，这位老哥丝毫不吝啬对它的夸奖，说它 “ 表现得像唯一排名第一的非推理模型 ” 。

让 V3-0324 生成一个网页，模型一口气写了 800 多行代码，运行的时候还没有出错，这什么实力不用多说了吧。

在评论区底下，有人仅仅下达了编写登录页面的简单指令，并没有任何其他的附加提示，同样也生成了一个完整的登录页面。

还说 V3-0324 在编码上，能跟 Claude 3.7 Sonnet 掰一掰手腕。

更别提其他的模型，性价比各方面相比下来，现在 OpenAI 的 o1-pro 和 GPT-4.5 ，都已经不香了。

反正看了几个网友的测试案例之后，世超对 V3-0324 的前端代码生成能力，已经有了初步的判断。

但不管咋说，没亲自上过手的东西，咱硬夸也有点心虚。所以这次世超也打算简单试一试，看看 V3-0324 到底有多能打。

一上来，世超就让模型做了一个画板，提示词是 “ 帮我用 HTML 代码构建一个画板，支持鼠标绘制、橡皮擦功能和颜色选择 ” ，这次出战的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。

只能说，这把 Claude 3.7 Sonnet 赢得很彻底。光是有取色器这一点，就甩了 V3-0324 不知道几个车尾灯。

更别提 UI 设计了， V3-0324 做出来的画板让世超不是很有创作的欲望。。。

世超着实是没想到，这盆凉水来得这么快，都让我有点怀疑到底是我的提示词没写好，还是模型有问题了。。。

不过，我后面又继续把小球弹跳的提示词，分别喂给了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 还有 DeepSeek-V3 。

这下味儿终于对了。V3-0324 生成的结果确实牛叉，能很清楚地看到小球在下落触底的时候，产生了小幅度的弹跳。

就是吧，老版本的 V3 压根没运行起来。。。只能说两个版本之间的差距高下立判了。

再来看普通版 Claude 3.7 Sonnet 的结果，优点是底下的转速、重力和摩擦力都是可调节的，弹跳看起来也没什么大问题，但小球有点出画面了。。。

最后，世超又分别让 V3 和 V3-0324 生成一个 Saas 登录页面，提示词就一句话，没有任何的附加信息。

可以看到， V3 的页面倒是做出来了，但没什么设计可言。

反观 V3-0324 ，果然就跟官方的版本更新说明一样，生成的网页更美观了。

综合看下来， V3-0324 的代码能力相比 V3 确实有了比较大的提升，而且在一部分测试案例中，也能够比肩普通版 Claude 3.7 Sonnet 。

但如果要说完全超越 Claude 3.7 Sonnet ，那世超觉着暂时还不太行。

不过大伙儿也别忘了， V3-0324 在开源这个赛道里， V3-0324 已经算得上能打的了。

而且 DeepSeek 的 API 价格业主打的一个便宜。世超对比了 Claude 3.7 Sonnet 和 V3-0324 的 API 价格， V3-0324 百万 tokens 输入的价格是 2 元，百万 tokens 输出的价格是 8 元，而同样的 tokens 数， Claude 3.7 Sonnet 的输入和输出价格分别是 36.6 元和 108.9 元，价差最多有 18 倍。

所以在某种程度上， V3-0324 这个小更新，的确可以跟 Claude 3.7 Sonnet 媲美。

特别是今天晚上，DeepSeek官方还发文，正式介绍了这波小更新，在数学、代码类的相关评测上，V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。

去年 12 月底 V3 上线，紧接着 R1 就在过年的时候上桌吃饭了。如果按照 DeepSeek 之前发布模型的节奏，盲猜一波 R2 也快了。

总之，小版本更新的 V3-0324 就已经如此强悍了，就是不知道，在 DeepSeek 猛烈的开源炮弹下， “OpenAI 们 ” 还遭不遭得住了。

举报收藏打赏 评论 0