GPT-5.6下周发布:150万token、价格砍半,大模型卷到头了?
GPT-5.6下周就要来了。150万token上下文、多模态全面升级、价格砍半——OpenAI的迭代速度已经快到让整个行业喘不过气。但问题是:大模型这么卷,到底卷到什么时候是个头?
GPT-5.6到底升级了什么?
5月26日,多名开发者在Codex后端日志中发现代号"iris-alpha"的未官宣模型,预计就是GPT-5.6。核心升级:
- 上下文窗口150万token — 较GPT-5.5的100万提升约43%,可以一次性处理整本《三体》三部曲
- 多模态全面升级 — 更精准的图像理解、更自然的视频分析
- 首次展现"实时多模态推理" — 边看边想边回答
更值得注意的是时间节奏:GPT-5.5发布仅三周后,继任者就已进入内部测试。这种迭代速度,在软件行业历史上都罕见。
上下文窗口:从"实用"到"无限"
两年前GPT-4的128K上下文已经让人觉得"够用了"。现在150万token意味着什么?你可以把一整个代码仓库、一整年的聊天记录、一整套法律文书一次性丢给AI,让它理解全局后再回答问题。
但更深层的变化是:上下文窗口的扩大正在杀死RAG。以前因为塞不下那么多文本,我们需要先检索再喂给模型(RAG方案)。现在直接全塞进去,让模型自己理解。RAG不会消失,但它的复杂度和必要性都在下降。
价格砍半:大模型正在变成水电煤
GPT-5.6预计价格砍半,这不是OpenAI的慈善行为,而是被迫应战。DeepSeek V4的推理成本只有GPT-5的1/30,GLM-5.2+Qwen3.7-Max混合方案让一家企业的月度AI支出从1.8万降到4200元。
大模型正在经历和云计算一样的价格曲线——越用越便宜,越便宜越多人用。IDC预测到2026年底,超过60%的企业级AI应用采用推理时计算架构。这意味着模型调用成本将成为企业IT支出的常规项,就像电费一样。
Codex整合ChatGPT:AI编程不再是程序员的专利
6月3日,OpenAI宣布把Codex核心能力整合进ChatGPT,面向全球用户开放,同步推出6款职场Codex插件,支持移动端接入和Triggers自动化流水线。
这意味着什么?以前AI编程是开发者的专属工具,现在产品经理、运营、数据分析师都能在ChatGPT里让AI帮自己写脚本、做自动化。AI编程的民主化,可能比AI编程本身更重要。
卷到什么时候是个头?
大模型的"卷"不会停,但卷的方向在变:
- 2023-2025年:卷参数、卷跑分——"我的模型比你大"
- 2026年上半年:卷上下文、卷价格——"我的窗口比你长、我的价格比你低"
- 2026年下半年:卷Agent、卷应用——"我的AI能干更多活"
对普通用户来说,好消息是AI越来越便宜、越来越好用。坏消息是,你需要不断学习新工具,否则很快就会被"会用AI的人"替代。
一句话:大模型卷到头了不重要,重要的是你能不能用这些模型卷出属于自己的机会。
参考来源:技术栈、OpenAI官方公告、36氪
发布时间:2026年6月22日
评论区