侧边栏壁纸
博主头像
西瓜码农

成功需要脚踏实地,一步一个脚印

  • 累计撰写 130 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

2026年大模型混战:国产选手集体爆发,DeepSeek把价格打到地板

来源: 2026年大模型混战:国产选手集体爆发,DeepSeek把价格打到地板

作者: Sider科技 | 时间: 2026-06-12

由西瓜码农博客自动抓取发布

2026年大模型混战:国产选手集体爆发,DeepSeek把价格打到地板

6月还没过完,大模型军备竞赛已经白热化了。

6月4日,OpenAI发布GPT-5。6月8日,微软Build大会一口气推出七款自研MAI模型。6月1日,MiniMax发布M3旗舰模型。这个节奏快到我都记不住谁是谁了。

但仔细看下来,2026年的大模型竞争,主线其实就三条:Agent能力、推理成本、多模态融合。

国产选手集体爆发

今年4月,被业内称为国产AI的"Agent爆发周"。月之暗面、阿里、腾讯、DeepSeek、字节、小米、智谱AI,九家头部厂商在一个月内密集发布旗舰模型——这不是"卷",这是什么?

几个关键数据:

  • Kimi K2.6在编程基准SWE-Bench Pro上以58.6%的得分首次登顶全球榜首,超越了Claude Opus
  • DeepSeek V4-Pro以1.6万亿参数成为当前开源模型之冠
  • 小米MiMo V2.5-Pro在多个榜单上逼近GPT-5
  • GLM-5.1在10万颗华为昇腾910B芯片上完成训练,标志着国产算力适配的实质性突破

这几个消息放一起看,你就明白国产AI现在是什么状态:不是追赶,是部分领域在并跑甚至领跑。

国产芯片也能跑大模型训练了

上周还有个更重磅的消息——深圳团队基于昇腾910C国产AI算力集群,完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。

翻译成人话就是:国产芯片,不只能做推理了,也能跑顶级大模型训练了。 之前很多人质疑国产AI芯片,说训练还得靠英伟达,现在这质疑基本被怼回去了。

Token价格战:DeepSeek的反向操作

如果说技术竞争是明线,那价格战就是暗线,而且这条线打得比技术战还狠。

5月底,DeepSeek V4-Pro直接宣布API永久降价75%——输入Token低至0.025元/百万Token,输出6元。缓存命中的输入价格几乎等于白送。

这事儿有意思在哪呢?行业里其他人在涨价,它在降价。

2026年以来,因为HBM价格暴涨(据说涨了500%),主流云厂商的API价格都在往上走。然后DeepSeek突然反手一刀,把价格砸到地板——这哪是商业决策,简直是价格恐怖袭击。

后果也很明显:中小企业用AI的门槛,被彻底打破了。 之前一个创业团队调用大模型API,一年的费用可能比服务器还贵;现在这个成本降了75%,基本上就是"忽略不计"级别的。

多模态才是主战场

但光靠价格战是走不远的。2026年的真正主线,我认为是多模态能力的落地。

英伟达在Computex 2026上发布了Cosmos 3,全球首款完全开源的全模态物理AI基础大模型。支持视频、传感器输入、文本、声音、动作——基本上把物理世界能感知到的模态全塞进去了。

这东西有什么用?物理AI。 机器人、自动驾驶、工业检测——这些需要理解真实物理世界的场景,是多模态AI最大的用武之地。

国产这边,卓驭科技也发布了原生多模态基础模型,已进入跨垂类规模化量产阶段。多模态大模型,从"能看能听"到"能理解能创造",这个进程在2026年明显加速了。

开源vs闭源,谁的路线对?

开源派(DeepSeek、GLM、MiMo)和闭源派(Kimi、GPT-5)各有各的市场。开源降低门槛、聚集社区力量;闭源保证商业化闭环和服务质量。

但我观察到一个趋势:随着模型能力越来越强,"模型本身"的价值在下降,"模型+应用"的价值在上升。 光靠模型能力已经不够了,还得有落地场景、还得能解决问题。

2026年,纯粹靠技术领先就能躺赢的时代,一去不复返了。

最后说个冷知识:OpenAI在6月4日发布GPT-5当天,Anthropic也提交了S-1上市申请。两大AI巨头,一个发新模型,一个筹备上市——同一天。 AI行业的商业化进程,正在加速。好戏还在后面。

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区