数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

Meta华人实习生：独立编写代码实现AI自我进化突破

Meta华人实习生：独立编写代码实现AI自我进化突破

热心网友时间：2026-03-31

转载

henry 发自凹非寺量子位 | 公众号 QbitAI能无限进步的「超级智能体」来了！最近，Meta研究团队的一篇题为HYPERAGENTS（超级智能体）的论文迅速刷屏。这篇论文将LSTM之父Jü

henry 发自凹非寺
量子位 | 公众号 QbitAI

能无限进步的「超级智能体」来了！

最近，Meta研究团队的一篇题为HYPERAGENTS（超级智能体）的论文迅速刷屏。

这篇论文将LSTM之父Jürgen Schmidhuber二十年前提出的哥德尔机（Gödel Machine）思想，与达尔文开放算法相结合，提出了能持续自我迭代的达尔文哥德尔机

基于此这一思想，Agent不仅能更好地完成具体任务、持续提高自身表现。

更关键的是，它可以不断优化“改进自身”的底层逻辑，实现“元学习（Meta-learning）”

这，便是论文定义的新一代超级智能体——Hyperagents

论文更进一步提出：未来AI有望通过持续自我迭代，最终突破人类预设的初始算法边界，也正因如此，AI安全必须被摆在核心位置。

不少网友也感慨道：

元学习真正让人既害怕又兴奋的，是元层面的改进能够跨领域迁移。这不是在某一件事上变得更厉害，而是学会了在一切事情上变得更厉害。

目前，这篇论文已被ICLR 2026接收。

从哥德尔机到达尔文哥德尔机

要理解超级智能体Hyperagents，必须先了解它的基石——

哥德尔机（Gödel Machine）

哥德尔机是一种假设性的自我完善型AI。它在数学上寻求证明：

如果存在某种更好的策略，它会通过递归重写自身代码来解决问题。

而这一假设，最早由尤尔根·施密德胡伯（Jürgen Schmidhuber）在二十多年前提出。

在传统机器学习中，AI的“学习方法”是人类预设的硬编码，它只能通过调整内部参数来逼近目标

而哥德尔机则打破了这一限制，它能够将算法框架本身视为可编辑的代码，通过自主重写程序来实现学习能力的自我演进

但问题也随之而来：哥德尔机往往要求AI在自我演进之前，证明该改动具备净收益。

也就是说，改代码花掉的算力成本，未来能不能通过更强的性能赚回来？

不幸的是，这种计算在现实中的复杂任务中几乎是无法实现的。

针对这一问题，Meta团队提出达尔文哥德尔机（DGM），它利用开放式算法（Open-ended algorithms），通过在大模型提议的代码改进方案中进行搜索，获取能从经验上提升性能的方案。

换句话说，DGM利用基础模型来提议代码改进方案，并利用开放式算法的最新创新成果，来搜索并构建一个不断增长的、多样化且高质量的AI智能体库。

基于此，DGM能创造出各种自我改进方案，例如：增加补丁验证（Patch Validation）步骤、优化文件查看功能、增强编辑工具、生成并筛选多个解决方案以选出最优解，以及在进行新更改时，会自动添加历史尝试记录（并分析失败原因）以供参考。

论文的实验还表明，DGM获得的算力越多，自我提升效果越好。

超级智能体

虽然DGM很强，但它存在一个致命限制：它主要在编程任务中有效

这是因为DGM依赖一个关键假设——评估任务与自我修改任务必须“对齐”。

在编程领域，这种对齐是天然的：提升了编程能力，自然也就提升了修改自身代码的能力。

也就是说，解决外部编程问题的逻辑工具，可以直接转化为修改其自身底层代码的能力。

相反，如果是在非编程领域（如写诗），即便提升了写诗能力，也无法直接转化为修改代码的逻辑水平。

在这种缺乏“自指性（Self-referentiality）”的任务中，DGM的递归进化链条就会断裂，陷入停滞。

基于此，文章提出超级智能体——

它们既能修改自己的任务执行行为，也能修改生成未来改进建议的过程。

这实现了所谓的元认知自我修改（metacognitive self-modification）：不仅学习如何做得更好，还学习如何更有效地进行改进。

进一步，论文将超级智能体实例化为DGM-Hyperagents (DGM-H)。

DGM-H是对DGM的扩展，其中任务解决行为和自我改进程序都是可编辑且可进化的，其框架如下：

自指性架构：它将“任务智能体（Task Agent）”与“元智能体（Meta Agent）”整合为一个单一的、可编辑的程序。元级进化：在Hyperagents中，“改进的方法”本身也是可以被改进的。这使得系统不再要求任务与修改必须对齐，从而实现了跨领域的“元认知自我修改”。

打个比方，在Hyperagents中，运动员不仅在训练，教练也在学习如何更好地执教。由此，运动员的表现和教练的执教水平不断螺旋上升。

此外，DGM-H还改进了生成新智能体的过程（例如引入持久化记忆、性能追踪等），且这些元级改进具有跨领域迁移和跨运行累积的特性。

实验验证：从20%到50%的跨越

实验证明，达尔文哥德尔机（Darwin Gödel Machine）能够通过修改自身代码库实现持续的自我提升。

在SWE-bench上，DGM自动将其性能从20.0%提升至50.0%

在Polyglot上，DGM的性能从初始的14.2%跃升至30.7%，远超由Aider开发的具有代表性的人工设计智能体。

这些结果证明了DGM能发现并实施有效的自我改进。

而实现这一点的关键在于其开放式进化搜索策略：

通过从现有智能体库中采样生成新智能体，DGM能够并行探索多条进化路径。

性能稍逊的“祖先”智能体在发现新方法和功能方面起关键作用，避免了早熟收敛。

此外，DGM的改进具有广泛的迁移性：

针对Claude 3.5 Sonnet优化的智能体，在切换到o3-mini或Claude 3.7 Sonnet时仍能提升性能。在Polyglot基准中，Python任务上的自我改进同样提升了Rust、C++、Go等不同语言任务的表现。

作者介绍

最后，让我们来介绍一下这篇论文的作者们。

这篇论文的第一作者是来自UBC的Jenny Zhang，她师从Jeff Clune教授。

她本科就读于帝国理工，这篇论文是她在Meta实习期间完成的。她的研究方向专注于强化学习、自改进AI与Open-Ended AI。

Bingchen Zhao是来自爱丁堡大学的博士生，，师从Oisin Mac Aodha教授

他本科毕业于同济大学，他此前在Meta FAIR团队，致力于构建自我改进的AI系统。

Wannan Yang在纽约大学攻读博士，目前在Meta超级智能实验室实习，她本科毕业于爱丁堡大学。

论文的其他作者还包括Jeff Clune、以及来自Meta的研究员Minqi Jiang（已离职）、Sam DevlinTatiana Shavrina。

[1]https://arxiv.org/pdf/2603.19461
[2]https://sakana.ai/dgm/
[3]https://x.com/jennyzhangzt

来源:https://www.163.com/dy/article/KPBMPBI60511DSSR.html

上一篇： EBOX司仪马杯S1全程守护，见证电竞新人豪取百万奖金

下一篇：无人机中国玩家入门：正确起飞几步搞定

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

一位技工在客户家地下室发现一台属于AMD前CEORoryRead的旧PC，机箱上留有苏姿丰等高管签名，配置为推土机时代硬件且从未开机。这台电脑封存了AMD从推土机失败到Zen架构崛起的关键转折历史。

时间：2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

Laravel 12生态成熟助力全栈开发效率提升

Laravel12延续开发体验优势，在项目结构、查询构建、API开发、调试及性能上持续优化。其生态日趋成熟，形成Reverb、Pulse等完整工具链，覆盖API、SaaS、企业后台及AI应用开发。与Next js的组合逐渐流行，Laravel已演变为现代Web开发平台，保持社区活力。

时间：2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

LinuxKernel6 15重大更新：Rust驱动正式入主线，NOVADRM成为首个实践案例；io_uring新增零拷贝网络接收，降低CPU开销与延迟；Btrfs增强实时zstd压缩、DirectIO及稳定性。内核同步推进安全化与高性能网络化。

时间：2026-07-10 10:06

谷歌Gemini进入Agent时代打造全天候AI助理

谷歌Gemini进入Agent时代打造全天候AI助理

Google推出GeminiSpark、Omni等新功能。Spark可全天候在后台运行，主动处理邮件、日历等任务；Omni侧重视频理解与环境推理，布局世界模型。AI正从被动回答转向主动观察、规划与执行，标志着竞赛进入新阶段。

时间：2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

CPU-Z2 20 2正式版发布，新增支持IntelPantherLake、WildcatLake、BartlettLake三大架构及AMD锐龙AIMax、Pro系列，加入锐炫G3识别库，修复缓存错误和锐龙77700X3D检测问题，免费下载。

时间：2026-07-10 10:05

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门数据榜

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

专业Logo设计打造令人难忘的品牌形象

Stratup.ai AI创业点子与工具平台

猫眼人工智能反欺凌软件学校智能监控与预警

SAP旗下最新推出的商业智能AI助手Joule全面介绍

AI-FraudGuard 智能电商欺诈预防与合规平台

智能定制化测验生成工具Criov

PicWish快速在线人工智能驱动全能图片编辑美化平台

PhishNet产品比价帮您找到最优优惠

AI驱动安全视频播客托管平台，畅享无忧流媒体

Anomify实时指标分析与问题解决异常检测AI平台

相关攻略

相关攻略

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

2026-07-10 10:06

地下室发现尘封12年AMD前CEO旧PC苏姿丰签名推土机硬件

Laravel 12生态成熟助力全栈开发效率提升

2026-07-10 10:06

Laravel 12生态成熟助力全栈开发效率提升

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

2026-07-10 10:06

Linux内核持续演进：Rust语言与零拷贝网络成新焦点

谷歌Gemini进入Agent时代打造全天候AI助理

2026-07-10 10:05

谷歌Gemini进入Agent时代打造全天候AI助理

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

2026-07-10 10:05

CPU-Z 2.20.2正式版发布支持Intel三大平台及AMD锐龙AI Max

苹果CEO库克主持WWDC26数次拭泪连说18声谢谢

2026-07-10 10:05

苹果CEO库克主持WWDC26数次拭泪连说18声谢谢

中国空间站成功培育出番茄

2026-07-10 10:05

中国空间站成功培育出番茄

A电竞全线领先锐龙5 9600X vs 酷睿Ultra5 250K PLUS八款游戏实测

2026-07-10 10:05

A电竞全线领先锐龙5 9600X vs 酷睿Ultra5 250K PLUS八款游戏实测

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

北境酒馆实况我在中世纪经营知名酒馆

北境酒馆实况我在中世纪经营知名酒馆发布于 2026-07-10

天堂2盟约剑盾职业玩法：技能搭配装备选择实战技巧

天堂2盟约剑盾职业玩法：技能搭配装备选择实战技巧发布于 2026-07-10

战意三国7月24日定档违约最高送1亿电影票

战意三国7月24日定档违约最高送1亿电影票发布于 2026-07-10

天堂2盟约手游深度评测：玩法特色、职业系统及新手入门指南

天堂2盟约手游深度评测：玩法特色、职业系统及新手入门指南发布于 2026-07-10

年大型手游排行榜前十人气耐玩网游大盘点

年大型手游排行榜前十人气耐玩网游大盘点发布于 2026-07-10

怪物猎人旅人冰原双刀强度解析与实战评测

怪物猎人旅人冰原双刀强度解析与实战评测发布于 2026-07-10

女生最爱玩的热门高人气手游推荐下载合集

女生最爱玩的热门高人气手游推荐下载合集发布于 2026-07-10

最新十大好用安卓手机飞机订票App推荐下载

最新十大好用安卓手机飞机订票App推荐下载发布于 2026-07-10

如何用Linux查看网络数据包在内核的流向

如何用Linux查看网络数据包在内核的流向发布于 2026-07-10

如何在CentOS 7中修改文件系统配额的具体操作步骤

如何在CentOS 7中修改文件系统配额的具体操作步骤发布于 2026-07-10

Linux查看具体硬件驱动列表的命令

Linux查看具体硬件驱动列表的命令发布于 2026-07-10

电脑0x800401f3无效类字符串系统底层报错解决

电脑0x800401f3无效类字符串系统底层报错解决发布于 2026-07-10

奔驰电动GLC与理想i6怎么选，40万内家用优势对比

奔驰电动GLC与理想i6怎么选，40万内家用优势对比发布于 2026-07-10

三星S20U设置5G后信号变差常见原因及解决方法

三星S20U设置5G后信号变差常见原因及解决方法发布于 2026-07-10

家用取暖器暖和又省电的选购指南与推荐

家用取暖器暖和又省电的选购指南与推荐发布于 2026-07-10

超声波加湿器如何安装使用更省电

超声波加湿器如何安装使用更省电发布于 2026-07-10

热门话题

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战