MiniMax M3来了,这次真的不一样
5月31日,MiniMax正式发布M3模型。我为什么单独拿出来说?因为这是国内第一个同时具备三个条件的开源模型:前沿编程能力、1M超长上下文、原生多模态。之前你要么选编程强的,要么选上下文长的,要么选多模态的,M3是第一个三合一的。
MSA架构是什么
M3用了全新的MSA(MiniMax Sparse Attention)稀疏注意力架构。名字听着学术,但效果很实在:SWE-Bench Pro上超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。多模态测试集OmniDocBench上也超过了Gemini 3.1 Pro。
说白了,M3在编程和文档理解这两个最吃香的场景上,已经能跟最顶级的闭源模型掰手腕了。而且它是开源的。
Mavis:多Agent桌面系统
比M3模型本身更让我感兴趣的是Mavis。5月28日MiniMax推出的这个多Agent桌面系统,支持微信和飞书接入,有上下文隔离和Team Engine编排。
什么意思呢?以前你用一个AI助手,它记不住上下文,或者上下文太长就乱了。Mavis的思路是:不同任务用不同Agent,各自有独立上下文,但可以通过Team Engine协调。这解决了一个很实际的问题——"上下文焦虑"。
我自己用AI工具最大的痛点就是:聊着聊着模型就忘了前面说的啥,或者塞太多东西进去它就开始胡说八道。Mavis这种多Agent隔离的方案,至少在架构层面是对的。
商业化数据
MiniMax的几个数字值得关注:全球企业开发者客户超百万,半年增长5倍;全球用户规模约3亿;ARR翻番周期压缩到60天。
60天翻一番,这个速度在SaaS领域基本闻所未闻。当然,MiniMax也在冲刺A股IPO,5月29日刚跟中信证券签了辅导协议。估值和股价表现都很猛,但亏损也在扩大——2025年净亏损2.51亿美元。
M3对开发者意味着什么
对开发者来说,M3最大的价值不是跑分,而是"一个模型解决多个问题"。以前做项目,编程用DeepSeek,长文档用Kimi,看图用GPT-4V,来回切换很麻烦。M3理论上一个模型全搞定。
当然,"理论上"和"实际上"之间还有距离。三合一意味着每个单项可能不是最强的,但对大多数应用场景来说够用了。配合MiniMax Code和Token Plan套餐,部署成本也相对可控。
MiniMax还同步推出了M1推理模型,号称全球首个开源大规模混合架构推理模型。M1+M3的组合,一个负责深度思考,一个负责全能执行,这个产品矩阵设计得挺有章法。
我的判断
M3的发布,标志着开源大模型进入了一个新阶段:不再是"能用",而是"好用"。1M上下文+编程+多模态三合一,加上Mavis多Agent系统,MiniMax在产品层面的思考比很多只堆参数的厂商要深入得多。
但挑战也很明显:三合一的模型,每个单项能做到什么水平?Mavis的多Agent协调,实际体验如何?这些都需要时间和用户验证。开源不等于免费午餐,部署和运维的成本还是得自己扛。
总的来说,M3给国产开源大模型立了一个新标杆。后面Qwen和DeepSeek怎么接招,才是真正好看的地方。
评论区