DeepSeek V4预览版发布：万亿参数原生多模态，500亿融资刷新大模型纪录

6月15日，深度求索（DeepSeek）正式发布新一代大模型DeepSeek V4预览版，同步开源权重并上线API服务。这是DeepSeek时隔15个月后的重大更新，距离V3发布已经过去很久了。

V4到底强在哪？

根据已公开的信息，DeepSeek V4采用了万亿参数规模，并且是原生多模态架构——不是那种"文本模型外挂视觉模块"的缝合怪，而是从底层就为图像、视频、文本全模态生成做了统一设计。

在AI编程能力方面，V4的表现据说已经超越了OpenAI GPT系列和Anthropic的同类模型。这个说法来自多个第三方评测，虽然具体基准测试数据还有待更多独立验证，但方向是明确的：国产大模型在代码生成这个硬指标上，正在缩小甚至抹平差距。

V4还深度融合了DeepSeek近期发表的两篇核心技术论文——mHC和Engram。这两项技术瞄准的是当前大模型发展的核心瓶颈：mHC解决的是"芯片墙"问题，即如何在有限算力下跑更大的模型；Engram则针对"内存墙"，让模型的长上下文处理更高效。简单说，DeepSeek不是单纯堆参数，而是在架构层面做了创新。

500亿融资意味着什么？

就在V4发布前后，DeepSeek完成了500亿元人民币的新一轮融资，刷新了中国大模型领域的融资纪录。这笔钱的规模放在全球AI圈也是顶级水平。

融资背后的逻辑很清楚：大模型的竞争已经进入"军备竞赛"阶段。训练一个万亿参数模型，算力成本动辄数亿美元，没有足够的弹药根本玩不下去。500亿让DeepSeek正式进入第一梯队，和OpenAI、Anthropic这些美国公司站在了同一个量级上。

但钱多不等于一定能赢。腾讯云、网易企业服务、京东工具链这些大厂已经在用DeepSeek的API了，说明商业化在推进。不过大模型赛道最终比的是技术迭代速度和生态粘性，这两点DeepSeek还需要持续证明自己。

我的看法

DeepSeek V4的发布时间点很有意思。Anthropic刚被美国政府禁了Fable 5和Mythos 5，OpenAI的GPT-5.5也在加速迭代。在这个节骨眼上，DeepSeek选择开源权重+上线API，等于是在告诉全世界：中国的大模型不是在追赶，而是在某些方向上已经可以并行跑了。

当然，"预览版"三个字说明V4还没完全准备好。性能到底能不能在真实场景中跑赢GPT-5.5，还得等更多开发者上手测试才知道。但至少，方向是对的——原生多模态、架构创新、开源生态，这三条路走通了，DeepSeek就不只是"中国的OpenAI"，而是一个有自己技术路线的玩家。

参考来源：华创微课、小道知道、智通财经APP

目录CONTENT

DeepSeek V4预览版发布：万亿参数原生多模态，500亿融资刷新大模型纪录

DeepSeek V4预览版发布：万亿参数原生多模态，500亿融资刷新大模型纪录

V4到底强在哪？

500亿融资意味着什么？

我的看法

评论区