当AI开始自己造AI：从工具到造物主的跨越

2024年，Devin横空出世，号称"全球首个AI程序员"，大多数人还在讨论"AI能不能写代码"。到了2026年中，问题已经变成了"AI能不能自己设计AI"。答案正在变得越来越肯定。

从AutoML自动搜索神经网络架构，到Sakana AI的"The AI Scientist"让AI自主做科研，再到Devin Desktop把IDE变成Agent指挥中心——AI正在从"被使用的工具"进化为"自主工作的智能体"，甚至开始参与设计下一代AI。

三条主线：AI造AI的2026版图

主线一：AutoML——让AI设计AI模型

AutoML（自动化机器学习）不是新概念，但2026年它终于从实验室走进了工程实践。核心思路很简单：把"设计神经网络架构"这件事也交给算法来做。

传统做法是人类专家凭经验选模型、调超参，费时费力还容易陷入局部最优。AutoML用神经架构搜索（NAS）在庞大的架构空间里自动探索，找到人类可能根本想不到的组合。Google的Cloud AutoML、开源的Auto-sklearn和TPOT，已经让非ML专家也能训练出不错的模型。

2026年6月，Red Hat发布了OpenShift AI上的AutoML和AutoRAG功能，把自动化从模型训练延伸到了RAG管道构建——连检索增强生成这种复杂系统都能自动调优了。

主线二：AI Scientist——让AI自主做科研

Sakana AI的"The AI Scientist"项目，可能是"AI造AI"最激进的尝试。它让AI自主完成科学研究的全流程：提出假设、设计实验、写代码验证、撰写论文、甚至模拟同行评审。

2026年6月，Sakana AI推出了基于这项研究的商业产品Sakana Marlin——一个"虚拟首席战略官"。它不是秒回的聊天机器人，而是能连续8小时自主推理的研究代理。你给它一个战略问题，它自己制定假设、搜索数据、交叉验证、最终输出一份100页的研究报告和演示文稿。

底层技术是自适应分支蒙特卡洛树搜索（AB-MCTS）——类似AlphaGo的推演逻辑，但用在研究上。系统把研究过程看作一棵可能性树，在每个节点动态决定是"探索新方向"还是"深挖已有线索"。更关键的是，它能动态选择调用哪个大模型处理子任务，把不同模型当作"即插即用的集体智能网络"。

Sakana AI由Transformer论文共同作者Llion Jones和前Google Brain研究员David Ha创立。他们的核心理念是：不造一个巨大全能模型，而是部署一群小型专业化模型动态协作——像鱼群一样。2026年初，他们的ALE-Agent在AtCoder编程竞赛中击败800多名人类选手拿下第一。

主线三：Agent指挥中心——让AI管理AI

2026年6月，Cognition宣布Windsurf正式升级为Devin Desktop。这不是简单改名，而是从"AI辅助编辑器"到"Agent指挥中心"的范式转移。

默认界面不再是代码编辑器，而是一个Kanban看板，统一管理本地和云端所有跑着的Agent会话。你可以同时开三五个任务：一个修bug、一个写测试、一个做重构，每个任务由独立的Agent负责。

最值得关注的是ACP（Agent Client Protocol）协议。它解决了一个关键问题：让任何Agent跑在任何编辑器里。在Devin Desktop里，你可以直接运行Codex、Claude Agent、OpenCode等第三方Agent，共享同一套UI和上下文。截至2026年6月，ACP已被JetBrains、Google、GitHub等采用，接入Agent超过25个。

这事的参照物是LSP（Language Server Protocol）。LSP之前，每个编辑器要为每种语言单独写支持；LSP之后，语言服务写一次到处能用。ACP在对Agent做同样的事：编辑器不再绑定自家Agent，Agent也不再绑定自家编辑器。

为什么是现在？三个条件同时成熟

算力成本下降：2024年跑一次NAS搜索要花几万美元，2026年用开源框架+云GPU几千块就能搞定。门槛降了一个数量级。
模型能力跃升：GPT-4o、Claude 3.5、通义千问等模型在代码生成和逻辑推理上的表现，已经足以支撑"AI写AI代码"这个闭环。
Agent基础设施成型：MCP、ACP等协议让Agent之间的协作有了标准接口，不再需要为每对Agent单独写适配代码。

冷静一下：离真正的"AI造AI"还有多远

标题说得热闹，但必须承认几个现实：

AutoML还做不到"从零创造"：它是在人类定义的搜索空间里找最优解，不是真的在发明新架构。给它一个全新的学习范式，它搜不出来。
AI Scientist的论文质量参差不齐：能跑通流程不等于产出有价值的研究。目前更像是"科研流水线"，离"有创造力的科学家"差得远。
Agent协作的可靠性不足：多Agent并行看起来很美，但Agent之间的冲突、上下文丢失、任务依赖管理都是未解难题。Devin Desktop的Kanban界面解决了展示问题，没解决协作问题。
安全边界模糊：当AI开始自主修改自己的代码和架构，如何确保它不会"优化"出危险的行为？目前没有成熟的治理框架。

对普通开发者意味着什么

如果你还在手调超参、手写模型架构，AutoML工具值得认真学。不是替代你，是让你把时间花在更有价值的地方。
如果你是团队技术负责人，关注ACP协议。2027年它大概率会成为Agent互操作的事实标准，就像LSP之于语言服务。
如果你在做AI研究，AI Scientist这类工具可以帮你快速验证想法的可行性，但别指望它替你想出诺奖级成果。
如果你担心被AI替代——短期内不会。但"只会调参"和"只会写CRUD"的人，确实该想想转型方向了。

写在最后

"AI造AI"不是科幻，但也没到革命。2026年的现实是：AI能自动化AI开发中的大量重复工作，能在人类划定的范围内搜索最优解，能并行处理多任务。但真正的创新——定义问题、选择方向、判断价值——仍然是人类的活。

与其焦虑"AI会不会自己造出更强大的AI然后取代我"，不如想想：当AI能帮你造AI的时候，你能用这个能力做什么原来做不到的事。

参考来源：

Sakana AI 官网 / Sakana Marlin 发布公告
AIEII《Windsurf 谢幕，Devin Desktop 登场》
Red Hat OpenShift AI AutoML/AutoRAG 公告
腾讯云开发者社区《Devin AI：从"首个全栈AI工程师"到2026年软件开发新范式》

发布时间：2026年6月20日

目录CONTENT

当AI开始自己造AI：从工具到造物主的跨越

当AI开始自己造AI：从工具到造物主的跨越

三条主线：AI造AI的2026版图

主线一：AutoML——让AI设计AI模型

主线二：AI Scientist——让AI自主做科研

主线三：Agent指挥中心——让AI管理AI

为什么是现在？三个条件同时成熟

冷静一下：离真正的"AI造AI"还有多远

对普通开发者意味着什么

写在最后

评论区