GPT-5.6下周发布：150万token、价格砍半，大模型卷到头了？

GPT-5.6下周就要来了。150万token上下文、多模态全面升级、价格砍半——OpenAI的迭代速度已经快到让整个行业喘不过气。但问题是：大模型这么卷，到底卷到什么时候是个头？

GPT-5.6到底升级了什么？

5月26日，多名开发者在Codex后端日志中发现代号"iris-alpha"的未官宣模型，预计就是GPT-5.6。核心升级：

更值得注意的是时间节奏：GPT-5.5发布仅三周后，继任者就已进入内部测试。这种迭代速度，在软件行业历史上都罕见。

两年前GPT-4的128K上下文已经让人觉得"够用了"。现在150万token意味着什么？你可以把一整个代码仓库、一整年的聊天记录、一整套法律文书一次性丢给AI，让它理解全局后再回答问题。

但更深层的变化是：上下文窗口的扩大正在杀死RAG。以前因为塞不下那么多文本，我们需要先检索再喂给模型（RAG方案）。现在直接全塞进去，让模型自己理解。RAG不会消失，但它的复杂度和必要性都在下降。

GPT-5.6预计价格砍半，这不是OpenAI的慈善行为，而是被迫应战。DeepSeek V4的推理成本只有GPT-5的1/30，GLM-5.2+Qwen3.7-Max混合方案让一家企业的月度AI支出从1.8万降到4200元。

大模型正在经历和云计算一样的价格曲线——越用越便宜，越便宜越多人用。IDC预测到2026年底，超过60%的企业级AI应用采用推理时计算架构。这意味着模型调用成本将成为企业IT支出的常规项，就像电费一样。

6月3日，OpenAI宣布把Codex核心能力整合进ChatGPT，面向全球用户开放，同步推出6款职场Codex插件，支持移动端接入和Triggers自动化流水线。

这意味着什么？以前AI编程是开发者的专属工具，现在产品经理、运营、数据分析师都能在ChatGPT里让AI帮自己写脚本、做自动化。AI编程的民主化，可能比AI编程本身更重要。

大模型的"卷"不会停，但卷的方向在变：

对普通用户来说，好消息是AI越来越便宜、越来越好用。坏消息是，你需要不断学习新工具，否则很快就会被"会用AI的人"替代。

一句话：大模型卷到头了不重要，重要的是你能不能用这些模型卷出属于自己的机会。

参考来源：技术栈、OpenAI官方公告、36氪

发布时间：2026年6月22日