Meta华人研究突破：AI智能体自进化新法则深度解析

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

Meta华人研究突破：AI智能体自进化新法则深度解析

热心网友时间：2026-05-20

转载

长期以来，人工智能智能体（AI Agent）的竞争焦点，始终围绕着“谁能更出色地完成特定任务”。然而，当前的研究风向正悄然转变，竞争的核心正逐步升级为“谁能更高效地实现自我进化”。近期，一项由Meta等机构发布的研究成果暗示，AI或许已经触及了“自我进化引擎”的门槛，开启了智能体发展的新篇章。

这项突破性研究由华人学者Jenny Zhang在Meta实习期间主导，联合了Meta AI、英属哥伦比亚大学（UBC）以及纽约大学的研究团队共同完成。他们提出了一个名为“HyperAgents”（DGM-H）的全新智能体框架，标志着AI自我进化能力的一次重要跃迁。

这项研究的核心目标，并非单纯打造一个执行任务能力更强的Agent。它旨在解决一个更高阶的元问题：既然AI已经能够优化自身解决任务的具体策略，那么它是否能够进一步优化“未来应如何优化自身”的这套元规则？

论文通过实验给出了肯定的答案。HyperAgents框架不仅从理论上论证了这种可能性，更在多个实际任务中验证了其系统性的自我进化能力。

HyperAgents实现突破的关键一步，在于将“执行具体任务的智能体”与“负责改进智能体的元智能体”融合进同一个可编辑的程序单元中，研究者将其称为“超级智能体”（hyperagent）。

在这一创新框架下，系统不仅能优化任务求解逻辑，更能对“未来如何生成改进方案”的元机制本身进行修改。论文将这种高阶能力定义为“元认知自我修改”。

这预示着一个潜在的范式转移：过去的竞争是“谁的Agent执行能力更强”，而HyperAgents所引领的下一阶段，则可能是“谁的Agent更擅长自我强化，并且越来越精通于如何变得更强大”。

传统“自我进化”的局限：半自动化模式

该论文清晰地揭示了上一代AI自我进化技术路线的天花板。

此前备受瞩目的“达尔文·哥德尔机”（Darwin Gödel Machine, DGM）已足够令人惊叹。它能够在编码任务中持续自我修改代码、验证结果，并将成功版本存档，以此为基础不断进化。数据显示，DGM在SWE-bench基准测试上将性能从20.0%提升至50.0%，在Polyglot基准上从14.2%提升到30.7%。

然而，DGM的有效性高度依赖于特定领域。在编码任务中，“评估代码质量”和“自我修改代码”本身也属于编码活动，任务能力与自我改进能力在此场景下天然对齐、相互促进。

一旦脱离编码领域，这种对齐关系便不复存在。例如，在评审学术论文、设计机器人奖励函数、或为国际数学奥林匹克（IMO）级别解答评分等任务中，表现出色并不意味着该智能体更擅长修改自身的元认知机制。

HyperAgents论文最核心的贡献，正是直接摒弃了“任务能力与元能力必然对齐”这一固有假设。既然两者未必一致，便不应再将元层的规则固化。这表明，过去许多所谓的“自我进化”系统，本质上仍在人类预设的轨道内运行。而HyperAgents真正实现的，是对“改变机制”本身的改变。

HyperAgents的创新本质是什么？

从表面看，HyperAgents似乎只是增加了一个元智能体（meta agent）。但其真正的革新之处，在于将任务智能体与元智能体深度融合进同一个可编辑的程序框架。

在传统的DGM架构中，系统包含一个手工设计的、固定不变的“指令生成机制”，它根据历史表现决定下一步如何修改。这个机制本身不可修改，因此反而成为了整个系统进化的瓶颈。

HyperAgents的解决方案，是将这部分核心机制也纳入可修改的范畴。换言之，AI不仅修改自己的答案、工具或流程，它开始修改“自己是如何构思修改建议的”。在DGM中，上层机制基本是静态的；而在DGM-H中，元层本身也进入了可演化空间。这意味着，它构建了一个能够自主经营其进化过程的智能系统。

因此，HyperAgents所做的并非简单地“增加一个Agent”，而是从根本上取消了“上层规则永恒不变”这一默认前提，实现了真正的元层进化。

自我改进能力的跨领域迁移

在编码任务中，HyperAgents在Polyglot基准上取得的提升与原始DGM处于同一量级：在50个任务的训练子集上，得分从0.140提升至0.340；在完整测试集上，从0.084提升到0.267。这表明其性能提升并未牺牲模型的泛化能力。

更关键的是，它的能力突破了编码领域的限制。在论文评审、机器人奖励函数设计等非编码任务上，系统同样展现出了持续自我改进的强大能力。

具体而言，在论文评审任务中，初始智能体在测试集得分为0.0，而DGM-H将其显著提升至0.710；在机器人奖励设计任务中，则从0.060提升到0.372。重要的是，这些提升不仅体现在训练任务中，也成功迁移到了预留的测试任务上，证明了其强大的泛化性。

对照实验的结果极具说服力：若关闭自我改进功能，效果明显减弱；若限制开放式探索，系统也难以取得实质性进展；而原始的DGM框架直接移植到非编码领域几乎失效，只有经过大量人工定制化改造（DGM-custom）后，才恢复部分竞争力。

这说明HyperAgents的核心价值，不在于某个特定基准测试上提升几个百分点，而在于它将原本依赖编码场景对齐关系的自我改进，推进成了一个能在多样化非编码任务中运行的通用进化框架。

其跨任务迁移能力尤为值得关注。研究者将在论文评审和机器人任务中演化出的超级智能体，迁移到奥林匹克级别的数学评分任务中。

尽管这些迁移体自身的初始评分能力接近零，但它们作为“能够生成更优智能体的元智能体”，在50轮迭代内就能将所生成的最佳智能体性能推升至0.630。相比之下，来自定制版DGM的迁移体几乎不具备这种能力。

这意味着，被成功迁移的不仅仅是任务经验，更为核心的是“如何持续变得更好”的元能力本身。这为构建通用的AI自我进化系统提供了关键思路。

自主构建内部“基础设施”

许多人谈及“自我进化”，可能认为不过是AI自行调整提示词、优化工作流或添加几条规则。但论文中最具冲击力的展示之一是：系统开始自主地生长出复杂的内部“基础设施”。

在迭代进化过程中，DGM-H会自动生成性能追踪模块、持久记忆系统、评估分析工具以及计算感知规划器等组件。

论文中甚至直接展示了由系统自动生成的性能追踪器代码和持久记忆条目：它开始记录跨代性能指标、总结哪些代际的策略有效、诊断过度修正问题，并主动制定下一轮的改进计划。

这已超越了简单的“日志记录”。系统开始将自我改进视为一个需要长期经营和优化的过程，而非一次次孤立的修补。它不仅记录每一代的分数，还会分析趋势、识别性能回退，并将跨代的有效经验沉淀到持久记忆中，形成可复用的知识资产。

正如一些观察者所指出的，让这一切成为现实的关键，恰恰是“持久记忆”能力的自主涌现。

论文展示的记忆示例中写道：某一代评审员准确率更高但过于严苛；另一代表现更平衡；下一轮改进的目标是融合两者的优点，取长补短。

没有这层记忆，智能体往往只会反复“重新发明轮子”；有了它，过去数代积累的有效经验才第一次能够真正沉淀为下一轮进化迭代的基石。这标志着智能体正从“输出单一结果”的工具，走向“维护一个持续优化、具备历史认知”的自治系统。

结论：非AGI宣言，但标志旧规则松动

必须明确指出，这项研究并未宣称“无限自我进化的AI”或通用人工智能（AGI）已经实现。作者在文中清晰地阐述了当前限制：所有实验均在受控的沙箱环境、资源限制和人工监督下完成；外层循环（如任务分布、父代选择策略、评估协议等）仍有部分未开放给系统自改；真正无界、开放式的自我改进，仍然任重道远。

然而，风险预警的信号已经清晰浮现。一旦AI开始修改自身的改进机制，相关的AI安全与对齐讨论就变得至关重要。论文也专门设立了章节讨论潜在风险：随着系统越来越擅长开放式地自我修改，其演化速度可能超越人类的审计和理解能力。今天依靠沙箱和人工监控或许尚可管控，未来的挑战将愈发严峻。

HyperAgents代表了一种前沿的AI技术路线，它很可能重塑智能体领域的竞争格局。未来的比拼可能不再只是谁会调优大模型、谁会设计工作流、谁会做出更强的单点工具，而是谁能将“自我改进能力”本身产品化、系统化，并实现高效的跨领域迁移。

这将深刻影响AI公司的核心竞争壁垒。真正的护城河，可能不再仅仅是参数规模、算力储备或数据量，而在于是否拥有一套能够跨任务累积经验、跨运行周期持续自我优化的内生进化系统。

同时，这也将重新定义开发者的角色。开发者不再仅仅是编写功能代码的人，而更像是在为AI设计可以继续自我设计与进化的初始边界条件与演化规则。

最重要的一点在于，它动摇了AI行业过去一条默认的规则：系统可以变得更强，但使其变强的方法论必须由人类来定义和掌控。现在，这条规则已经开始松动。我们正在步入一个AI不仅能够完成任务，更能自主探索如何更好地进化的新时代。

来源:https://www.51cto.com/article/840009.html

上一篇：阿里巴巴与上海AI实验室联合发布人工智能白皮书

下一篇：全国医保影像AI识图大赛8月启动赋能数据价值释放

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

明末渊虚之羽望山村女眷支线任务攻略

原神哥伦比娅配队思路与阵容搭配推荐

火焰审判手游职业解析指南与选择推荐

天羽传奇职业选择指南与全职业介绍

白金撒花成就解锁攻略与获取方法详解

中世纪建筑结构稳定性解析与建造技巧

童话师墙后装饰摆放技巧与布置方法

造梦西游4手游邮件系统使用与查看方法

三角洲行动怦然心动效果调整方法详解

王者荣耀世界共鸣系统玩法详解与实战技巧

洛克王国星之路位置与前往方法详解

洛克王国龙须小径位置与前往路线详解

洛克王国家园解锁方法详细步骤指南

洛克王国水晶神殿进入方法及问题解决

洛克王国吹笛子动作使用教程

我的世界基岩版自定义NPC制作与召唤指令教程

洛克王国雷电迷踪活动地图位置详解

光与影远征队布料获取与衣物制作材料教程

洛克王国钓鱼馆位置与前往路线详解

像素火影网页版正版免费入口官方在线畅玩地址

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

2015-03-10 12:39

《英雄坛说》详细全攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

街头美食逆袭礼包码大全官方未过期兑换码福利汇总发布于 2026-05-20

仙武云梦川2026最新礼包码免费领取与兑换教程发布于 2026-05-20

灵兽神兽专属大招使用技巧与觉醒技搭配攻略发布于 2026-05-20

答题获取见闻录攻略轻松答题赢取游戏道具发布于 2026-05-20

超能下蛋鸭游戏0.01折正版下载免费领取折扣福利入口发布于 2026-05-20

楚新钓最强阵容搭配攻略八大T0组合推荐发布于 2026-05-20

仙缘无限仙玉版下载安装内置菜单破解版获取方法发布于 2026-05-20

2026年三角洲行动猛攻节活动福利详情介绍发布于 2026-05-20

CAC 2026前瞻：中国战队本土作战迎强敌发布于 2026-05-20

俯视动作冒险游戏Elementallis将于4月29日正式发售发布于 2026-05-20

饥困荒野官网预约地址及游戏入口获取指南发布于 2026-05-20

洛克王国世界里奥进化攻略与形态详解发布于 2026-05-20

Necrophosis完全意识版5月28日正式发售发布于 2026-05-20

三国志战略版机关神兵队阵容搭配攻略发布于 2026-05-20

云之国击岩采石场全收集攻略视频流程详解发布于 2026-05-20

和平精英2026新春版本评测：值得体验的春节玩法与更新内容发布于 2026-05-20

Windows 11 系统提示即将过期？教你重新激活的完整步骤发布于 2026-05-20

Win11连接4K电视无声音 HDMI音频同步问题解决方法发布于 2026-05-20

Win11画图3D使用教程快速制作三维模型与艺术字发布于 2026-05-20

Win10关闭自动更新设置教程按流量计费网络优化指南发布于 2026-05-20

Windows 驱动备份教程一键批量导出所有驱动程序发布于 2026-05-20

Win11壁纸无法设置怎么办桌面背景更换失效解决方法发布于 2026-05-20

麒麟系统中文乱码解决方法修改字符集步骤详解发布于 2026-05-20

Linux系统编译安装Python 3.13最新版教程与特性解析发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

Meta华人研究突破：AI智能体自进化新法则深度解析

传统“自我进化”的局限：半自动化模式

HyperAgents的创新本质是什么？

自我改进能力的跨领域迁移

自主构建内部“基础设施”

结论：非AGI宣言，但标志旧规则松动

工具调用JSON数据格式的可靠性保障机制解析

中关村论坛智能体解决方案：枫清科技赋能智慧交流

湖南科职携手360共建AI数字安全人才培养基地

哈萨比斯传记揭秘鲜为人知的幕后故事

血液检测新突破：AI模型精准识别多种神经退行性疾病