稀疏注意力突围：一家创业公司声称突破了LLM十年的数学瓶颈

上个月，迈阿密一家叫Subquadratic的AI创业公司从隐身状态冒出来，放了个大招：他们说自己解决了困扰大语言模型近十年的数学瓶颈。

这话听着像吹牛。毕竟过去几年，类似的大话听太多了。但这次有点不一样——他们找了第三方机构Appen做独立测试，结果还真有点东西。

问题在哪：为什么LLM这么吃算力

先说清楚这个"瓶颈"是什么。

现在的大模型都用Transformer架构，核心机制叫"密集注意力"（dense attention）。原理是这样的：模型处理一段文本时，要把每个词跟其他所有词都算一遍关系。

比如你要让模型总结《了不起的盖茨比》，它得把第一个词和最后一个词配对，然后跟其他所有组合都配一遍。一篇1万字的文本，差不多要算5000万次乘法。

这叫二次方增长。词数翻倍，计算量翻四倍。这就是为什么大模型这么吃显卡、这么费电。

他们的思路很简单：不是所有词之间的关系都重要。

你在读书的时候，不会把每个词都跟其他词联系起来想。第一段和最后一段可能有关系，但第一个字和第三个字之间大概率没什么联系。

这叫"稀疏注意力"——只算那些真正重要的词对。

这想法不新鲜，之前很多人试过。问题是：你怎么知道哪些词对重要？以前的做法是用固定模式，比如"总是比较第1个词和第5个词"。但语言太复杂了，这种死板规则效果不好。

Subquadratic说自己解决了这个问题：他们用动态选择，根据具体文本实时决定哪些词对重要。具体怎么选的？那是商业机密，他们没说。

Appen的测试报告显示：

但有几个问题需要注意：

独立研究员Will Depue的评价比较中肯："他们可能确实做出了有用的东西，但现有证据还不足以支撑'解决了二次方注意力瓶颈'这个更强的声明。"

如果Subquadratic的方案真的能规模化，影响会很大：

但现在下结论还太早。等更多人拿到模型、在更多场景测试过，才能知道这是"自Transformer以来最大突破"还是另一个AI Theranos。

来源：MIT Technology Review

链接：https://www.technologyreview.com/2026/06/19/1139313/a-startup-claims-it-broke-through-a-bottleneck-thats-holding-back-llms/