GPT-5.6下周发布:150万token价格砍半
OpenAI又要发新模型了。这次是GPT-5.6,预计下周发布。
核心参数已经泄露:150万token上下文窗口、价格砍半、双向语音。OpenAI首席科学家已经确认了上下文窗口的数据。
但这次发布,OpenAI有点进退两难。
为什么说进退两难
因为Claude Fable 5刚被美国政府禁了。
6月9日,Anthropic发布Claude Fable 5和Mythos 5,号称地表最强AI。三天后,美国商务部紧急叫停,理由是国家安全风险。
这给OpenAI提了个醒:模型太强,可能也会被禁。
GPT-5.6有多强?150万token上下文,是GPT-4的10倍。这意味着你可以把一整本书扔进去,让它从头读到尾。
但这也意味着,模型的能力可能触及监管红线。OpenAI内部已经在讨论:要不要推迟发布?
150万token意味着什么
先解释一下token。简单说,token是模型处理文本的基本单位。一个汉字大约是1-2个token。
GPT-4的上下文窗口是12.8万token,大约相当于8万汉字。GPT-5.6的150万token,大约相当于100万汉字。
这是什么概念?
- 一本《三体》大约80万字
- 一份完整的法律卷宗可能50万字
- 一个大型项目的所有代码可能100万字
有了150万token窗口,你可以把一整本书、一份完整卷宗、整个项目代码一次性塞给模型。不需要分段、不需要摘要、不需要担心信息丢失。
这对编程、法律、研究场景是革命性的。
价格砍半意味着什么
OpenAI这次要把价格砍半。
GPT-4现在的价格是:输入$0.03/1K token,输出$0.06/1K token。
如果砍半,GPT-5.6的价格可能是:输入$0.015/1K token,输出$0.03/1K token。
这意味着什么?
第一,大模型进入"白菜价"时代。两年前,GPT-3的价格是$0.02/1K token。现在GPT-5.6可能比GPT-3还便宜,但能力强了不知道多少倍。
第二,调用成本不再是瓶颈。以前用大模型,得精打细算,能少调用就少调用。现在价格砍半,可以放心大胆地用。这对Agent应用是重大利好——Agent需要频繁调用模型,成本一直是制约因素。
第三,竞争压力传导。DeepSeek、智谱、Kimi都在打价格战。OpenAI不降价,用户就会流失。这次价格砍半,是对国产大模型的直接回应。
双向语音是什么
GPT-5.6还支持双向语音。
以前的语音模式是:你说一句话,模型回一句话。像对讲机。
双向语音是:你和模型可以同时说话,像打电话。模型可以随时打断你,你也可以随时打断模型。
这听起来简单,技术难度很高。需要实时处理音频流,需要理解打断的意图,需要保持对话的连贯性。
但如果实现了,语音交互的体验会彻底改变。不再是"你说完我再说",而是真正的自然对话。
OpenAI的监管困境
回到开头的问题:OpenAI为什么进退两难?
因为Claude Fable 5被禁,给行业敲响了警钟。
美国政府禁Claude Fable 5的理由是:模型能力太强,可能被用于生物武器、网络攻击等危险场景。
GPT-5.6的能力可能接近甚至超过Claude Fable 5。如果发布后被禁,OpenAI就尴尬了。
所以OpenAI内部在纠结:要不要主动限制模型能力?要不要推迟发布?要不要先和监管机构沟通?
但竞争对手不会等你。DeepSeek V4已经发布了,智谱GLM-5.2也开源了。OpenAI如果推迟,市场就会被抢走。
对用户意味着什么
如果你是普通用户,GPT-5.6发布是好事。
更强的能力、更大的上下文、更低的价格、更好的语音体验。ChatGPT会变得更好用。
如果你是开发者,GPT-5.6发布也是好事。
150万token窗口,意味着可以处理更复杂的任务。价格砍半,意味着成本压力减轻。双向语音,意味着可以开发更自然的语音应用。
但如果你关注AI安全,GPT-5.6发布可能让你担忧。
模型越来越强,监管越来越紧。这个矛盾怎么解,现在没人知道答案。
GPT-5.6下周发布,基本确定了。OpenAI的纠结,反映了整个行业的困境:技术进步和监管约束,到底该怎么平衡?
这个问题,不是OpenAI一家能回答的。需要政府、企业、学术界、公众一起讨论。
但在答案出来之前,GPT-5.6会先发布。技术进步不会等人。
评论区