DeepSeek V4来了：1.6万亿参数开源，百万上下文成标配，下半年适配华为芯片

等了半年，DeepSeek V4终于来了。

4月底一个平平无奇的周五下午，DeepSeek把V4放了出来——没有发布会，没有直播，没有路线图。同步开源，同步上线官网和App，同步更新API。就这么悄无声息地扔了个重磅炸弹。

两个版本，顶配和性价比之选

这次V4一口气发了两个版本：

DeepSeek-V4-Pro：对标顶级闭源模型，1.6T参数，49B激活，上下文长度1M。官方说法是"在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先"。 DeepSeek-V4-Flash：更小更快的经济版，284B参数，13B激活，上下文同样1M。推理能力接近Pro，世界知识储备稍逊，但API更便宜。

有意思的是，DeepSeek自己说了——目前V4已经成为公司内部员工使用的Agentic Coding模型，使用体验优于Sonnet 4.5，交付质量接近Opus 4.6非思考模式。这话从一个中国AI公司嘴里说出来，分量不轻。

百万上下文：从高端功能变成水电煤

这个变化我觉得值得单独拿出来说。

一年前，1M上下文还是Gemini独家的王牌，其他闭源模型要么128K要么200K，开源这边几乎没人玩得起这个量级。DeepSeek直接把百万上下文从一个"高端功能"挪成了所有官方服务的标配，而且开源。

怎么做到的？V4开创了一种全新的注意力机制——在token维度进行压缩，结合DSA稀疏注意力一起用，对计算和显存的需求大幅降低。

DSA其实不是新东西。半年前V3.2-Exp那次更新首次引入，当时外界关注度不高，因为跑分和V3.1-Terminus几乎一样，看起来像一次没什么料的中间版本。现在回头看，那是V4的地基。这种"悄悄铺路"的打法，很DeepSeek。

Agent能力专项优化

V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品做了适配和优化，代码任务、文档生成任务都有提升。复杂Agent场景官方建议直接上思考模式的max档。

API价格方面，两个版本最大上下文都是1M，都同时支持非思考模式和思考模式。思考模式下可以通过reasoning_effort参数调强度，两档high和max。base_url不变，model参数改成deepseek-v4-pro或deepseek-v4-flash即可调用。

下半年支持华为算力

划重点：下半年支持华为算力。

另外，旧模型名要下架了。deepseek-chat和deepseek-reasoner将在三个月后（2026年7月24日）停用，当前阶段这两个名字分别指向V4-Flash的非思考和思考模式。对个人开发者影响不大，改个model参数就行；对接了生产环境的公司，这三个月得赶紧做迁移。

不诱于誉，不恐于诽

发布稿的结尾，DeepSeek自己引了荀子《非十二子》里的一句话：

> 不诱于誉，不恐于诽，率道而行，端然正己。

过去半年，关于V4什么时候发、是不是跳票、是不是已经被别家超越之类的传言在中文和英文AI圈来回跑了好几轮。年初甚至有人信誓旦旦说V4会在春节前发，结果等到了四月底。

他们没回应过一次。然后在某个周五的下午，把V4放出来，同步开源，同步上线，顺便把内部员工已经弃用Claude的事实写进发布稿。

率道而行这四个字，听着像口号。但如果你把V3.2那次"没什么亮点"的Exp版本、DSA那套为V4铺了半年的稀疏注意力、1M上下文从王牌变成标配的这条路径放在一起看——DeepSeek确实做到了。

来源： 36氪 / 量子位 原文链接： https://www.36kr.com/p/3780290045121801 发布时间： 2026年4月

目录CONTENT

DeepSeek V4来了：1.6万亿参数开源，百万上下文成标配，下半年适配华为芯片

DeepSeek V4来了：1.6万亿参数开源，百万上下文成标配，下半年适配华为芯片

两个版本，顶配和性价比之选

百万上下文：从高端功能变成水电煤

Agent能力专项优化

下半年支持华为算力

不诱于誉，不恐于诽

评论区