侧边栏壁纸
博主头像
西瓜码农

成功需要脚踏实地,一步一个脚印

  • 累计撰写 128 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

MiniMax M3开源:编程+1M上下文+多模态,三合一来了

MiniMax M3来了,这次真的不一样

5月31日,MiniMax正式发布M3模型。我为什么单独拿出来说?因为这是国内第一个同时具备三个条件的开源模型:前沿编程能力、1M超长上下文、原生多模态。之前你要么选编程强的,要么选上下文长的,要么选多模态的,M3是第一个三合一的。

MSA架构是什么

M3用了全新的MSA(MiniMax Sparse Attention)稀疏注意力架构。名字听着学术,但效果很实在:SWE-Bench Pro上超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。多模态测试集OmniDocBench上也超过了Gemini 3.1 Pro。

说白了,M3在编程和文档理解这两个最吃香的场景上,已经能跟最顶级的闭源模型掰手腕了。而且它是开源的。

Mavis:多Agent桌面系统

比M3模型本身更让我感兴趣的是Mavis。5月28日MiniMax推出的这个多Agent桌面系统,支持微信和飞书接入,有上下文隔离和Team Engine编排。

什么意思呢?以前你用一个AI助手,它记不住上下文,或者上下文太长就乱了。Mavis的思路是:不同任务用不同Agent,各自有独立上下文,但可以通过Team Engine协调。这解决了一个很实际的问题——"上下文焦虑"。

我自己用AI工具最大的痛点就是:聊着聊着模型就忘了前面说的啥,或者塞太多东西进去它就开始胡说八道。Mavis这种多Agent隔离的方案,至少在架构层面是对的。

商业化数据

MiniMax的几个数字值得关注:全球企业开发者客户超百万,半年增长5倍;全球用户规模约3亿;ARR翻番周期压缩到60天。

60天翻一番,这个速度在SaaS领域基本闻所未闻。当然,MiniMax也在冲刺A股IPO,5月29日刚跟中信证券签了辅导协议。估值和股价表现都很猛,但亏损也在扩大——2025年净亏损2.51亿美元。

M3对开发者意味着什么

对开发者来说,M3最大的价值不是跑分,而是"一个模型解决多个问题"。以前做项目,编程用DeepSeek,长文档用Kimi,看图用GPT-4V,来回切换很麻烦。M3理论上一个模型全搞定。

当然,"理论上"和"实际上"之间还有距离。三合一意味着每个单项可能不是最强的,但对大多数应用场景来说够用了。配合MiniMax Code和Token Plan套餐,部署成本也相对可控。

MiniMax还同步推出了M1推理模型,号称全球首个开源大规模混合架构推理模型。M1+M3的组合,一个负责深度思考,一个负责全能执行,这个产品矩阵设计得挺有章法。

我的判断

M3的发布,标志着开源大模型进入了一个新阶段:不再是"能用",而是"好用"。1M上下文+编程+多模态三合一,加上Mavis多Agent系统,MiniMax在产品层面的思考比很多只堆参数的厂商要深入得多。

但挑战也很明显:三合一的模型,每个单项能做到什么水平?Mavis的多Agent协调,实际体验如何?这些都需要时间和用户验证。开源不等于免费午餐,部署和运维的成本还是得自己扛。

总的来说,M3给国产开源大模型立了一个新标杆。后面Qwen和DeepSeek怎么接招,才是真正好看的地方。

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区