侧边栏壁纸
博主头像
西瓜码农

成功需要脚踏实地,一步一个脚印

  • 累计撰写 151 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

DeepSeek V4预览版发布:万亿参数原生多模态,500亿融资刷新大模型纪录

DeepSeek V4预览版发布:万亿参数原生多模态,500亿融资刷新大模型纪录

6月15日,深度求索(DeepSeek)正式发布新一代大模型DeepSeek V4预览版,同步开源权重并上线API服务。这是DeepSeek时隔15个月后的重大更新,距离V3发布已经过去很久了。

V4到底强在哪?

根据已公开的信息,DeepSeek V4采用了万亿参数规模,并且是原生多模态架构——不是那种"文本模型外挂视觉模块"的缝合怪,而是从底层就为图像、视频、文本全模态生成做了统一设计。

在AI编程能力方面,V4的表现据说已经超越了OpenAI GPT系列和Anthropic的同类模型。这个说法来自多个第三方评测,虽然具体基准测试数据还有待更多独立验证,但方向是明确的:国产大模型在代码生成这个硬指标上,正在缩小甚至抹平差距。

V4还深度融合了DeepSeek近期发表的两篇核心技术论文——mHC和Engram。这两项技术瞄准的是当前大模型发展的核心瓶颈:mHC解决的是"芯片墙"问题,即如何在有限算力下跑更大的模型;Engram则针对"内存墙",让模型的长上下文处理更高效。简单说,DeepSeek不是单纯堆参数,而是在架构层面做了创新。

500亿融资意味着什么?

就在V4发布前后,DeepSeek完成了500亿元人民币的新一轮融资,刷新了中国大模型领域的融资纪录。这笔钱的规模放在全球AI圈也是顶级水平。

融资背后的逻辑很清楚:大模型的竞争已经进入"军备竞赛"阶段。训练一个万亿参数模型,算力成本动辄数亿美元,没有足够的弹药根本玩不下去。500亿让DeepSeek正式进入第一梯队,和OpenAI、Anthropic这些美国公司站在了同一个量级上。

但钱多不等于一定能赢。腾讯云、网易企业服务、京东工具链这些大厂已经在用DeepSeek的API了,说明商业化在推进。不过大模型赛道最终比的是技术迭代速度和生态粘性,这两点DeepSeek还需要持续证明自己。

我的看法

DeepSeek V4的发布时间点很有意思。Anthropic刚被美国政府禁了Fable 5和Mythos 5,OpenAI的GPT-5.5也在加速迭代。在这个节骨眼上,DeepSeek选择开源权重+上线API,等于是在告诉全世界:中国的大模型不是在追赶,而是在某些方向上已经可以并行跑了。

当然,"预览版"三个字说明V4还没完全准备好。性能到底能不能在真实场景中跑赢GPT-5.5,还得等更多开发者上手测试才知道。但至少,方向是对的——原生多模态、架构创新、开源生态,这三条路走通了,DeepSeek就不只是"中国的OpenAI",而是一个有自己技术路线的玩家。


参考来源:华创微课、小道知道、智通财经APP
0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区