侧边栏壁纸
博主头像
西瓜码农

成功需要脚踏实地,一步一个脚印

  • 累计撰写 128 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

DeepSeek V4.1定档6月:多模态+MCP协议,Agent时代的入场券

来源: DeepSeek V4.1定档6月:多模态+MCP协议,Agent时代的入场券

作者: AI产品库 | 时间: 2026-06-17

由西瓜码农博客发布

DeepSeek V4.1定档6月:多模态+MCP协议,Agent时代的入场券

DeepSeek又要搞事情了

5月底,DeepSeek宣布新一代大模型V4.1将于2026年6月正式发布。如果你对大模型行业有所关注,应该知道V4在4月24日发布后引发了怎样的震动——1.6万亿参数、MIT协议全量开源、百万级上下文、API价格只有同类的1/50。现在V4.1要来了,而且这次的方向很明确:多模态+企业级工具链。

V4.1的三大核心升级

根据目前公开的信息,V4.1将带来三大核心升级:

第一,首次集成图像与音频理解能力,实现文本+图像+音频的全模态输入。V4是纯文本模型,不支持图片和视频理解。V4.1补上了这个短板,而且不是简单的后期融合,而是原生多模态架构。

第二,引入MCP协议支持。MCP(Model Context Protocol)是Anthropic提出的一套让AI模型与外部工具交互的标准协议。简单说,就是让模型能调用文件系统、数据库、API等外部工具。这对Agent场景至关重要——没有MCP,模型只能写代码给你看;有了MCP,模型能替你把代码跑起来。

第三,企业级工具链集成。具体细节还没公布,但从DeepSeek近期的动作来看,大概率会包括代码审查、自动化测试、CI/CD集成等开发流程工具。

V4已经打下的底子

要理解V4.1的意义,得先回顾V4打下的底子。

V4采用1.6万亿总参数+混合注意力栈的架构,100万Token全量支持。SWE-bench Verified得分80.6%,在开源/开放权重模型中排名顶级。API价格更是行业屠夫级别:V4 Flash每百万token输出0.28美元,V4 Pro优惠期每百万token输出0.87美元。

对比一下:Claude Sonnet 4.7输出价格约120美元/百万token,GPT-5.5输出30美元/百万token。DeepSeek V4 Pro优惠价的成本仅为Claude Sonnet 4.7的1/432,GPT-5.5的1/360。个人开发者每月成本不到50元,效率却没降。

但V4也有明显的短板:不支持多模态,没有MCP协议,企业级功能缺失。V4.1就是来补这些课的。

多模态:从追赶到超越?

多模态能力是V4.1最受关注的升级。目前国产开源大模型中,Kimi K2.5已经支持文本+视觉+视频输入,Qwen3.6-VL也具备多模态能力。DeepSeek在V4上跳过了多模态,专注文本和代码能力,现在V4.1补上这一课。

关键问题是:V4.1的多模态是原生架构还是后期融合?从官方透露的信息来看,是原生多模态架构,这意味着图像和音频理解不是外挂的,而是跟文本能力一起训练的。原生多模态的优势在于跨模态理解更自然——比如你给它一张架构图,它不仅能识别图中的内容,还能理解图与文本描述之间的逻辑关系。

MCP协议:Agent时代的入场券

MCP协议的引入可能是V4.1最具战略意义的升级。目前AI编程赛道正在从写代码向做任务演进。Claude Code之所以强大,不只是因为Opus模型强,更因为它能通过MCP调用文件系统、终端、浏览器等工具,完成从写代码到验证代码效果的全流程。

DeepSeek V4没有MCP支持,这意味着它只能生成代码,不能执行代码。V4.1补上MCP后,理论上可以接入Claude Code、Cline、Roo Code等主流AI编程工具,成为Claude Opus的平替。

考虑到V4的API价格只有Claude Opus的1/432,如果V4.1的MCP能力达到可用水平,对成本敏感的开发者来说将是极具吸引力的选择。

行业格局:价格战进入深水区

DeepSeek V4.1发布的大背景是:大模型价格战进入深水区。

5月底,DeepSeek宣布V4-Pro永久降价75%,每百万tokens输出价格处于行业最低水平。OpenAI也在6月启动了首轮大规模API降价。而智谱GLM-5系列则在持续涨价,Coding Plan套餐三轮调价涨幅超30%。

行业定价正在分化:以每百万tokens输出价格3美元为分界线,之上是生产力核心场景(价格敏感度低),之下是性价比竞争(价格敏感度高)。DeepSeek显然选择了后者——用极致低价抢占开发者生态。

这个策略的效果已经开始显现。中国日均Token调用量已突破140万亿次,较2024年初增长超千倍。DeepSeek V4-Flash以3.69万亿Token(环比+19%)连续三周蝉联全球调用量第一。

融资与估值:资本加速向头部集中

6月17日,DeepSeek完成首轮融资500亿元人民币,创下中国AI史上最大单笔融资。梁文锋个人出资200亿(占比40%),腾讯出资100亿,宁德时代50亿。估值从4月的100亿美元飙升至450亿美元

从三不(不融资、不商业化、不路演)到资本+生态双轮驱动,DeepSeek的战略转向非常明显。V4.1的多模态+MCP+企业工具链,就是这种转向的具体体现——不再只是做技术标杆,而是要做商业生态。

V4.1能否延续V4的统治力?

V4的成功在于:用1%的成本实现了顶级模型90%的能力。V4.1要证明的是:在补上多模态和MCP之后,能不能在Agent场景也做到这一点。

我的判断是:V4.1大概率会在性价比上继续保持碾压级优势,但在代码质量上跟Claude Opus 4.8仍有差距。对于大多数个人开发者和中小团队来说,这个差距可以接受——毕竟价格差了上百倍。但对于追求极致代码质量的大型项目,Claude仍然是首选。

不过,DeepSeek的迭代速度确实惊人。从V3到V4到V4.1,不到一年时间三次大版本更新,每次都在缩小与顶尖模型的差距。如果V4.1的多模态和MCP能力达到预期,2026年下半年国产大模型在编程场景的整体竞争力将再上一个台阶。

参考来源:AI产品库

发布日期:2026年6月17日

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区