首页
科技
上海AI Lab携手华师大发布智能编程框架,开发效率提升50%

上海AI Lab携手华师大发布智能编程框架,开发效率提升50%

热心网友
转载
2025-10-18
来源:https://36kr.com/p/3513137225669769

在编程领域,大语言模型已经能够书写出正确而优雅的程序代码。但在机器学习工程的实战场景中,它距离真正"赢得比赛"仍有不小的差距。

因为像AutoML任务与Kaggle竞赛,不仅要求生成可运行的代码,更需要在数据处理、算法设计层面实现持续迭代与性能调优。以往,这一过程往往依赖专家经验与反复试错,导致模型难以高效突破瓶颈。

然而,目前基于大模型的机器学习智能体仍受限于两大核心问题:

缺乏细粒度的领域先验知识,导致在庞大搜索空间中探索效率低下;

传统的线性或树状搜索结构让不同分支彼此孤立,经验难以共享复用,从而限制了智能体的自我进化能力。

简单来说,当前的大模型会写代码,却尚未掌握"智能优化"的精髓。

在这一背景下,上海人工智能实验室联合华东师范大学提出了AutoMLGen——一个融合通用大模型推理与领域知识的智能编程框架。

其核心为自研的蒙特卡洛图搜索(MCGS),通过"分支—节点动态融合"机制突破传统MCTS的孤立局限,让不同搜索分支可共享高价值节点,并结合领域知识库与算子级优化,将搜索重点快速聚焦到有效空间,实现轨迹复用、跨分支聚合与过程学习。

AutoMLGen在仅使用DeepSeek-R1模型的情况下,以36.4%的平均奖牌率和18.7%的金牌率登顶MLE-Bench榜单,用标准时长一半(12小时)的计算预算实现"更准确、更快速、更节省",体现了AI智能体从"代码生成"到"算法优化"能力的质变飞跃。

AutoMLGen框架:融合知识与图搜索的智能优化引擎

AutoMLGen是一个面向机器学习工程任务的智能优化框架,让大语言模型在代码生成之外,具备了持续优化与经验重用的能力。

不同于传统依赖"暴力搜索"的AutoML系统,AutoMLGen以知识为导向、以结构化探索为核心,使智能体能在复杂任务中不断学习、逐步成长。

框架由领域知识库、蒙特卡洛图搜索与细粒度算子库三大模块组成:知识库提供经验启发,图搜索承担动态探索,算子库确保执行稳定。三者协同构建出一个从经验指引→智能探索→方案精修的进化闭环,真正让AI实现从"生成"走向"优化"的跨越式发展。

领域知识库:让智能体从"零经验"快速觉醒

优秀的机器学习工程师总能凭借经验在模型选型、特征处理和策略设计上做出关键判断。

AutoMLGen将这些经验系统化,构建了覆盖模型层、数据层与策略层的知识体系:模型层汇总不同任务下的高效架构与使用要点,数据层聚焦预处理与特征工程技巧,策略层则凝练自Kaggle实战的优化思路,如TTA、伪标签与模型集成等。

在任务启动阶段,AutoMLGen会自主判断是否启用领域知识,在保持智能体决策独立性的同时有效缓解冷启动问题。

进入探索阶段后,它能按需启发式地调用知识片段,在动态试探与自我修正中实现经验迁移与能力觉醒,真正让智能体从"新手"进化为懂策略、会优化的"专家级AI"。

MCGS图搜索:在迭代中成长,在融合中优化

传统的搜索算法(如MCTS)虽能在单一路径中平衡探索与利用,但由于分支独立、信息孤立,在复杂任务中效率受限。

AutoMLGen创新性地提出了蒙特卡洛图搜索,在搜索过程中引入图结构,让不同分支的节点和轨迹能够动态融合与共享,实现真正意义上的"经验互通"。

MCGS通过四种核心机制推动智能体的持续进化:主扩展沿当前路径稳步推进探索;分支内演化回顾自身历史经验教训;跨分支参考学习其他分支的优解;多分支聚合融合不同方案的优势,重组出更具创新性的解法。

通过从"线性树"到"图式网络"的跃迁,MCGS让智能体具备了跨分支学习与多解融合的能力,在有限预算下实现更快收敛与更优性能,真正让搜索过程具备了学习、反思与进化的智能特征。

细粒度算子库:连接节点的进化工具

在AutoMLGen中,细粒度算子库承担连接不同方案的桥梁角色,定义了解法之间的演化方式——从草稿生成到改进增强,从错误修复到性能微调,再到不同方案的有机融合。它为MCGS提供了一套通用的演化逻辑,让智能体能够在图结构中自由流动,在不断跳转与修正中持续探索新解。

这种机制让优化过程更连贯、更高效,也让AutoMLGen从"代码生成器"成长为能主动反思与改进的"AI工程师"。

实验结果与分析

整体性能

AutoMLGen在MLE-Bench上刷新了自动机器学习智能体的纪录。仅用12小时预算(标准时长的一半),便实现36.4%平均奖牌率与18.7%的金牌率,在同类系统中表现最优,展现出在有限算力下的强大竞争力。

在更轻量级的MLE-Bench-Lite测试中,AutoMLGen依然领先,以显著优势超越现有方法,体现出稳定性能与出色的泛化能力。

在高难度任务中,AutoMLGen在多数竞赛中取得领先,进一步证明其在复杂场景下的稳定性与进化能力。

模块消融分析

消融实验显示,各模块在性能提升中均发挥关键作用。知识库的引入为搜索指明方向;分支内演化机制让智能体学会反思与修正;跨分支参考与多分支聚合进一步增强方案融合与知识共享,使整体搜索更高效、更稳健。

现象分析

AutoMLGen在不同基础模型上均展现出优异适配性。更强的基模型带来更高上限,不同模型在文本、图像与表格任务中各展所长。

随时间推移,性能曲线快速收敛并持续上升,始终高于基线水平,展现出系统的动态优化与稳健成长能力。

案例展示

典型案例展示彰显了AutoMLGen从问题理解到方案实现的全过程,突出其在推理、代码生成与性能优化中的自主进化能力。

前景与展望

AutoMLGen的出现,不仅体现了性能层面的提升,更标志着智能体在复杂工程与算法设计任务中的能力演进。它证明了AI在高复杂度任务中具备自主探索与持续提升的潜力。

通过融合领域知识与图结构搜索,AutoMLGen让智能体具备了自我反思、跨分支学习与方案融合的能力,在有限资源下实现高效而稳健的优化,推动从"生成代码"向"理解并优化算法"的跃迁。

更重要的是,这一理念正向更广泛的智能系统范式扩展——从算法发现自动化到工程设计自主化,从多智能体协作到基于图结构的搜索逻辑与知识复用机制,为未来智能体的发展提供通用演化框架。

随着记忆与协作机制的持续引入,AutoMLGen有望成长为一个能够主动理解、创新并改进的"AI工程伙伴",为人工智能迈向更高层次的智能化与自我改进奠定坚实基础。

论文链接:https://arxiv.org/abs/2510.08511

项目仓库:https://github.com/Alpha-Innovator/InternAgent

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

保时捷双向并进:以双线战略应对电动化布局挑战

保时捷CEO奥博穆近日对一款即将发布的新车给予高度评价,称其为“最具驾驶乐趣的车型”。这款引发关注的车型,正是保时捷首款纯电718跑车。据透露,该车通过优化电池与电机布局,将整备质量控制在1600-

2025-10-18.

全球首台中红外观测设备AIMS启用,解密太阳磁场奥秘

近日,由中国科学院国家天文台主导建设的“用于太阳磁场精确测量的中红外观测系统”(AIMS)通过国家验收并正式投入使用。该设备是全球首台专用于中红外波段太阳磁场观测的仪器,也是我国首台工作在中红外波段

2025-10-18.

2025安徽民企百强揭晓:联宝比亚迪荣登营收与制造业前五

近日,安徽省2025年度民营企业百强榜单在合肥正式揭晓。此次发布的榜单涵盖“营收百强”“制造业百强”“服务业百强”及“吸纳就业百强”四大类别,全面展现了安徽民营经济的发展活力。 在营收百强

2025-10-18.

王腾力荐红米K90 Pro Max:与雷军互动官宣发布时间

红米手机最新近日正式对外公布了K90 Pro Max的发布时间,并首次向公众展示了该款新机的真机外观。这一消息迅速引发了科技爱好者和消费者的广泛关注。作为红米K系列的最新力作,K90 Pro Max

2025-10-18.

缅怀中科院巨匠杨振宁:103岁辞世,心系家国铸传奇

2025年10月18日,享誉全球的物理学家、诺贝尔物理学奖得主杨振宁教授在北京溘然长逝,享年103岁。这位跨越世纪的科学巨匠,以毕生精力投身于物理学研究,为人类科学事业树立了不朽丰碑。杨振宁1922

2025-10-18.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
蛋仔派对体验服
蛋仔派对体验服 休闲益智 2025-10-18更新
查看
王者荣耀国际服体验服正
王者荣耀国际服体验服正 角色扮演 2025-10-18更新
查看
王者荣耀应用宝
王者荣耀应用宝 角色扮演 2025-10-18更新
查看
王者荣耀
王者荣耀 角色扮演 2025-10-18更新
查看
阿姐鼓3偃师传游戏
阿姐鼓3偃师传游戏 动作冒险 2025-10-18更新
查看
王者荣耀国际服正
王者荣耀国际服正 角色扮演 2025-10-18更新
查看
天谕手游
天谕手游 角色扮演 2025-10-18更新
查看
蛋仔派对腾讯
蛋仔派对腾讯 休闲益智 2025-10-18更新
查看
蛋仔派对先锋
蛋仔派对先锋 休闲益智 2025-10-18更新
查看
蛋仔派对小米
蛋仔派对小米 休闲益智 2025-10-18更新
查看