28.9万亿Token碾压全球:中国AI大模型变天了
一、一个让美国人坐不住的数据
前几天刷到一条消息,让我愣了半分钟:OpenRouter公布的最新数据显示,全球AI大模型的周调用量达到了28.9万亿Token,连续五周上涨。
最炸裂的是这个对比:中国大模型的调用量是美国的近两倍。不是一倍,是近两倍——中国9.2万亿,美国4.9万亿。
DeepSeek-V4-Flash单周调用量3.43万亿Token,全球第一。这个数字,比整个美国市场加起来还多。
这已经不是"追赶"了,这是"碾压"。
二、Claude登顶:不是靠更大,而是靠更"老实"
5月底,Anthropic发布了Claude Opus 4.8。这个版本最让人意外的不是跑分,是它变"老实"了。
以前你问AI一个它不确定的问题,它大概率会一本正经地编个答案。Opus 4.8不一样——它会主动告诉你:"这个地方我不太确定,你最好再查一下。"
在代码审查任务中,Opus 4.8漏看代码缺陷的概率,只有前代的四分之一。
更关键的是价格。新增的"快速模式"比上一代旗舰便宜3倍,速度快2.5倍。在Artificial Analysis排行榜上,Opus 4.8直接把GPT-5.5拉下第一。
Anthropic自己说得很清楚:这代的核心不是"更强",而是"更可托付"。
三、中国模型凭什么碾压全球?
凭什么是DeepSeek?答案就一个字:便宜。
DeepSeek-V4-Pro的定价,大约是GPT-5.5的十分之一。缓存命中时,每百万Token只要2分钱人民币。对,你没看错——2分钱。
今年5月,DeepSeek正式宣布,之前2.5折的限时优惠直接变成常态化定价。低价不是促销,而是新常态。
全球调用量前九名里,DeepSeek一家占了三个席位(V4-Flash、V4-Pro、V3.2)。多型号矩阵,覆盖不同价格带——这打法,像极了当年小米用红米+小米+MIX三条线打手机市场。
MiniMax的M3模型更狠:综合性能对标Claude Sonnet,但定价只有它的五分之一。MiniMax的年化收入已经翻倍到3亿美元以上,企业用户超过100万。
摩根士丹利的报告指出:中国头部模型的词元消耗份额,从去年4月的5%一路飙升到今年3月的32%。短短一年,从"可以忽略"变成"举足轻重"。
四、苹果下场:AI竞争进入操作系统层
如果说Claude和DeepSeek是"模型层"的竞争,那苹果的加入,直接把战火烧到了"操作系统层"。
WWDC 2026上,苹果发布了全新的Siri AI。不再是以前那个只会设闹钟的语音助手——它能跨App操作、读懂屏幕内容、上网搜索实时信息,甚至能根据你拍的食物照片自动算卡路里。
背后用的是Google Gemini模型。苹果选了一个很"苹果"的做法:自己不做大模型,但把最好的模型整合进自己的生态里。
Xcode 27也集成了AI编码能力,支持调用Claude和Gemini。当苹果开始认真做AI,意味着这项技术不再是极客的玩具,而是要进入十亿人的口袋了。
五、三个被忽视的真相
真相一:AI竞争的主战场,正在从"谁更强"变成"谁更便宜好用"。 Claude赢了GPT-5.5,靠的不是参数更大,而是更诚实、更可靠、更便宜。DeepSeek称霸全球调用量,靠的也不是技术碾压,而是极致性价比。 真相二:中国模型不是在追赶,而是在重新定义游戏规则。 全球调用量前五名,中国占了四席。DeepSeek的低价策略已经常态化,MiniMax的企业用户在半年内翻了四倍。 真相三:AI正在从"聊天工具"变成"基础设施"。 苹果把AI嵌入了操作系统,Anthropic在推"动态工作流"让AI自动拆解和执行复杂任务。AI不再是你"打开一个App聊天"的东西,而是像电力一样,渗透到每一个软件、每一个流程里。六、对普通人意味着什么?
第一,别再纠结"用哪个模型最好"。 这个月的冠军下个月可能就换了。重要的是选一个靠谱的、性价比高的,然后把时间花在怎么用好它上。 第二,关注"Agent"这个方向。 无论是Anthropic的动态工作流、苹果的跨App操作,还是DeepSeek的工具调用能力,所有厂商都在往同一个方向走——让AI不只是回答问题,而是帮你做事。 第三,价格战对你来说是好事。 DeepSeek 2分钱百万Token、MiniMax五分之一的价格、Claude快速模式降了三倍——这些都不是新闻里的数字,而是你明天用AI的成本。越来越便宜,越来越强大,这是确定的趋势。2026年6月,AI的天变了。变的不是某一个模型的能力,而是整个游戏的规则。从"谁最强"到"谁最实用",从"聊天玩具"到"基础设施",从"美国独大"到"中美两极"——这些变化,正在同时发生。
大多数人还没意识到,但你已经看到了。
评论区