侧边栏壁纸
博主头像
西瓜码农

成功需要脚踏实地,一步一个脚印

  • 累计撰写 141 篇文章
  • 累计创建 1 个标签
  • 累计收到 0 条评论

目 录CONTENT

文章目录

当AI开始自己造AI:从工具到造物主的跨越

当AI开始自己造AI:从工具到造物主的跨越

2024年,Devin横空出世,号称"全球首个AI程序员",大多数人还在讨论"AI能不能写代码"。到了2026年中,问题已经变成了"AI能不能自己设计AI"。答案正在变得越来越肯定。

从AutoML自动搜索神经网络架构,到Sakana AI的"The AI Scientist"让AI自主做科研,再到Devin Desktop把IDE变成Agent指挥中心——AI正在从"被使用的工具"进化为"自主工作的智能体",甚至开始参与设计下一代AI。

三条主线:AI造AI的2026版图

主线一:AutoML——让AI设计AI模型

AutoML(自动化机器学习)不是新概念,但2026年它终于从实验室走进了工程实践。核心思路很简单:把"设计神经网络架构"这件事也交给算法来做。

传统做法是人类专家凭经验选模型、调超参,费时费力还容易陷入局部最优。AutoML用神经架构搜索(NAS)在庞大的架构空间里自动探索,找到人类可能根本想不到的组合。Google的Cloud AutoML、开源的Auto-sklearn和TPOT,已经让非ML专家也能训练出不错的模型。

2026年6月,Red Hat发布了OpenShift AI上的AutoML和AutoRAG功能,把自动化从模型训练延伸到了RAG管道构建——连检索增强生成这种复杂系统都能自动调优了。

主线二:AI Scientist——让AI自主做科研

Sakana AI的"The AI Scientist"项目,可能是"AI造AI"最激进的尝试。它让AI自主完成科学研究的全流程:提出假设、设计实验、写代码验证、撰写论文、甚至模拟同行评审。

2026年6月,Sakana AI推出了基于这项研究的商业产品Sakana Marlin——一个"虚拟首席战略官"。它不是秒回的聊天机器人,而是能连续8小时自主推理的研究代理。你给它一个战略问题,它自己制定假设、搜索数据、交叉验证、最终输出一份100页的研究报告和演示文稿。

底层技术是自适应分支蒙特卡洛树搜索(AB-MCTS)——类似AlphaGo的推演逻辑,但用在研究上。系统把研究过程看作一棵可能性树,在每个节点动态决定是"探索新方向"还是"深挖已有线索"。更关键的是,它能动态选择调用哪个大模型处理子任务,把不同模型当作"即插即用的集体智能网络"。

Sakana AI由Transformer论文共同作者Llion Jones和前Google Brain研究员David Ha创立。他们的核心理念是:不造一个巨大全能模型,而是部署一群小型专业化模型动态协作——像鱼群一样。2026年初,他们的ALE-Agent在AtCoder编程竞赛中击败800多名人类选手拿下第一。

主线三:Agent指挥中心——让AI管理AI

2026年6月,Cognition宣布Windsurf正式升级为Devin Desktop。这不是简单改名,而是从"AI辅助编辑器"到"Agent指挥中心"的范式转移。

默认界面不再是代码编辑器,而是一个Kanban看板,统一管理本地和云端所有跑着的Agent会话。你可以同时开三五个任务:一个修bug、一个写测试、一个做重构,每个任务由独立的Agent负责。

最值得关注的是ACP(Agent Client Protocol)协议。它解决了一个关键问题:让任何Agent跑在任何编辑器里。在Devin Desktop里,你可以直接运行Codex、Claude Agent、OpenCode等第三方Agent,共享同一套UI和上下文。截至2026年6月,ACP已被JetBrains、Google、GitHub等采用,接入Agent超过25个。

这事的参照物是LSP(Language Server Protocol)。LSP之前,每个编辑器要为每种语言单独写支持;LSP之后,语言服务写一次到处能用。ACP在对Agent做同样的事:编辑器不再绑定自家Agent,Agent也不再绑定自家编辑器。

为什么是现在?三个条件同时成熟

  • 算力成本下降:2024年跑一次NAS搜索要花几万美元,2026年用开源框架+云GPU几千块就能搞定。门槛降了一个数量级。
  • 模型能力跃升:GPT-4o、Claude 3.5、通义千问等模型在代码生成和逻辑推理上的表现,已经足以支撑"AI写AI代码"这个闭环。
  • Agent基础设施成型:MCP、ACP等协议让Agent之间的协作有了标准接口,不再需要为每对Agent单独写适配代码。

冷静一下:离真正的"AI造AI"还有多远

标题说得热闹,但必须承认几个现实:

  • AutoML还做不到"从零创造":它是在人类定义的搜索空间里找最优解,不是真的在发明新架构。给它一个全新的学习范式,它搜不出来。
  • AI Scientist的论文质量参差不齐:能跑通流程不等于产出有价值的研究。目前更像是"科研流水线",离"有创造力的科学家"差得远。
  • Agent协作的可靠性不足:多Agent并行看起来很美,但Agent之间的冲突、上下文丢失、任务依赖管理都是未解难题。Devin Desktop的Kanban界面解决了展示问题,没解决协作问题。
  • 安全边界模糊:当AI开始自主修改自己的代码和架构,如何确保它不会"优化"出危险的行为?目前没有成熟的治理框架。

对普通开发者意味着什么

  • 如果你还在手调超参、手写模型架构,AutoML工具值得认真学。不是替代你,是让你把时间花在更有价值的地方。
  • 如果你是团队技术负责人,关注ACP协议。2027年它大概率会成为Agent互操作的事实标准,就像LSP之于语言服务。
  • 如果你在做AI研究,AI Scientist这类工具可以帮你快速验证想法的可行性,但别指望它替你想出诺奖级成果。
  • 如果你担心被AI替代——短期内不会。但"只会调参"和"只会写CRUD"的人,确实该想想转型方向了。

写在最后

"AI造AI"不是科幻,但也没到革命。2026年的现实是:AI能自动化AI开发中的大量重复工作,能在人类划定的范围内搜索最优解,能并行处理多任务。但真正的创新——定义问题、选择方向、判断价值——仍然是人类的活。

与其焦虑"AI会不会自己造出更强大的AI然后取代我",不如想想:当AI能帮你造AI的时候,你能用这个能力做什么原来做不到的事。

参考来源

  • Sakana AI 官网 / Sakana Marlin 发布公告
  • AIEII《Windsurf 谢幕,Devin Desktop 登场》
  • Red Hat OpenShift AI AutoML/AutoRAG 公告
  • 腾讯云开发者社区《Devin AI:从"首个全栈AI工程师"到2026年软件开发新范式》

发布时间:2026年6月20日

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区