MiniMax M3开源：编程+1M上下文+多模态，三合一来了-西瓜码农

MiniMax M3来了，这次真的不一样

5月31日，MiniMax正式发布M3模型。我为什么单独拿出来说？因为这是国内第一个同时具备三个条件的开源模型：前沿编程能力、1M超长上下文、原生多模态。之前你要么选编程强的，要么选上下文长的，要么选多模态的，M3是第一个三合一的。

M3用了全新的MSA（MiniMax Sparse Attention）稀疏注意力架构。名字听着学术，但效果很实在：SWE-Bench Pro上超过GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7。多模态测试集OmniDocBench上也超过了Gemini 3.1 Pro。

说白了，M3在编程和文档理解这两个最吃香的场景上，已经能跟最顶级的闭源模型掰手腕了。而且它是开源的。

比M3模型本身更让我感兴趣的是Mavis。5月28日MiniMax推出的这个多Agent桌面系统，支持微信和飞书接入，有上下文隔离和Team Engine编排。

什么意思呢？以前你用一个AI助手，它记不住上下文，或者上下文太长就乱了。Mavis的思路是：不同任务用不同Agent，各自有独立上下文，但可以通过Team Engine协调。这解决了一个很实际的问题——"上下文焦虑"。

我自己用AI工具最大的痛点就是：聊着聊着模型就忘了前面说的啥，或者塞太多东西进去它就开始胡说八道。Mavis这种多Agent隔离的方案，至少在架构层面是对的。

MiniMax的几个数字值得关注：全球企业开发者客户超百万，半年增长5倍；全球用户规模约3亿；ARR翻番周期压缩到60天。

60天翻一番，这个速度在SaaS领域基本闻所未闻。当然，MiniMax也在冲刺A股IPO，5月29日刚跟中信证券签了辅导协议。估值和股价表现都很猛，但亏损也在扩大——2025年净亏损2.51亿美元。

对开发者来说，M3最大的价值不是跑分，而是"一个模型解决多个问题"。以前做项目，编程用DeepSeek，长文档用Kimi，看图用GPT-4V，来回切换很麻烦。M3理论上一个模型全搞定。

当然，"理论上"和"实际上"之间还有距离。三合一意味着每个单项可能不是最强的，但对大多数应用场景来说够用了。配合MiniMax Code和Token Plan套餐，部署成本也相对可控。

MiniMax还同步推出了M1推理模型，号称全球首个开源大规模混合架构推理模型。M1+M3的组合，一个负责深度思考，一个负责全能执行，这个产品矩阵设计得挺有章法。

M3的发布，标志着开源大模型进入了一个新阶段：不再是"能用"，而是"好用"。1M上下文+编程+多模态三合一，加上Mavis多Agent系统，MiniMax在产品层面的思考比很多只堆参数的厂商要深入得多。

但挑战也很明显：三合一的模型，每个单项能做到什么水平？Mavis的多Agent协调，实际体验如何？这些都需要时间和用户验证。开源不等于免费午餐，部署和运维的成本还是得自己扛。

总的来说，M3给国产开源大模型立了一个新标杆。后面Qwen和DeepSeek怎么接招，才是真正好看的地方。