大模型往哪走?DeepSeek和OpenAI当面掰扯清楚了
6月9号,一场关于大模型未来方向的对话在圈内引发了不少讨论。DeepSeek方面的人直接跟OpenAI的人坐在一起,聊了一个所有人都关心的问题:大模型到底该往哪走?
没有共识的分类体系
DeepSeek那边的嘉宾说了句大实话:目前行业根本就没有一套成熟、公认的大模型分类体系。不同的人有截然不同的划分逻辑——有人按参数规模分,有人按应用场景分,有人按训练方式分。
这其实暴露了一个问题:大模型发展太快,连从业者自己都没想清楚该怎么归类。就像2015年的深度学习,大家都在做,但没人能给出一个清晰的框架。
DeepSeek的路线选择
从DeepSeek这几年的动作来看,它的路线很明确:用更少的算力做更好的模型。
V4系列继续走MoE架构,推理效率远超同参数量的稠密模型。开源策略也没变——预览版直接开源,让社区一起迭代。这种"开源换影响力"的打法,跟OpenAI的封闭路线形成了鲜明对比。
有意思的是,OpenAI也在变。最近开始考虑降价、开放更多API能力,某种程度上是被DeepSeek逼的。
价格战只是表象
很多人把注意力放在了价格战上,但这场对话揭示了一个更深层的问题:大模型的竞争正在从"谁的参数多"转向"谁更懂用户"。
DeepSeek在中文场景下的表现已经不输GPT-4了,这不是靠堆参数堆出来的,而是靠对中文语料和用户习惯的深度理解。OpenAI的强项在英文和代码,但在中文场景下,国产模型的优势越来越明显。
未来三年的关键变量
对话中提到了几个值得关注的趋势:
- 多模态融合:纯文本模型的天花板已经很明显了,视觉、语音、视频的融合是必然方向
- 端侧部署:Kairos-4B已经证明了小模型端侧直驱的可行性,这会改变大模型的使用方式
- Agent化:模型不再只是回答问题,而是能自主完成复杂任务
我的判断
大模型的未来不会是一家独大。OpenAI有先发优势和生态,DeepSeek有成本优势和开源社区,Anthropic有安全叙事。三足鼎立的格局至少会持续两三年。
对普通用户来说,这是最好的时代——选择多、价格低、迭代快。但也要保持清醒:模型能力再强,最终解决问题的还是人,不是模型。
来源: 黑马风云(微信公众号) 发布时间: 2026年6月12日
评论区