当前位置: 首页
科技数码
微软发布代码生成新技术,单次可输出36K行高效代码

微软发布代码生成新技术,单次可输出36K行高效代码

热心网友 时间:2025-10-07
转载

自然语言规划的模糊性让仓库生成屡屡翻车。微软 RPG 用图谱取代文字,节点代表功能与文件,边标注依赖与接口。基准显示,功能创新率 11-13%,代码通过率 69.7%,远超 Claude Code,为大规模 AI 开发铺平道路。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

近年来,大模型写代码的能力突飞猛进。在函数级、文件级上,生成已相当可靠;开发者一句描述就能得到完整函数或模块。

但当视野扩展到整个仓库时,难题随之而来:数十上百文件、类与函数之间交织着复杂依赖,要从抽象描述落到完整仓库,始终充满挑战。

现有方法多依赖自然语言规划来决定「做什么、怎么做」。这种方式虽直观,却天生模糊、缺乏结构,难以长程稳定地追踪依赖。

结果就是两类常见失效:要么功能提案不全,难以覆盖需求;要么实现过程漂移,接口和模块边界逐渐错乱。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

论文地址:https://arxiv.org/ abs / 2509.16198

为解决这一问题,微软提出了 Repository Planning Graph (RPG),以结构化图谱替代脆弱的文字规划,把功能、文件、依赖和数据流统一在一张蓝图中,从而让仓库生成首次具备可控、可扩、可验证的基础。

从需求到仓库的统一蓝图

Repository Planning Graph (RPG) 是一种结构化表征,它把仓库生成的全过程统一到一张图里。

RPG 的节点可以是功能目标、文件、类或函数,边则显式标注接口调用、依赖关系和数据流动。

这种设计既能回答「要实现什么」(提案层),也能回答「如何实现」(实现层),从而保证高层意图与底层实现的一致性。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

ZeroRepo 流程概览:(A) 提案级构建:将用户需求转化为功能图谱;(B) 实现级构建:进一步细化为文件结构和数据流,形成 Repository Planning Graph (RPG);(C) 图驱动生成:沿拓扑顺序遍历 RPG,逐步生成完整仓库。

在此基础上,研究团队提出了 ZeroRepo 框架。ZeroRepo 从用户的自然语言描述出发,分三步逐步构建 RPG 并在其指导下生成代码:

第一步:提案级构建

ZeroRepo 不再让模型「即兴发挥」,而是先把用户的自然语言需求落到 RPG 上,逐步长成一张功能图谱。

它依托一个庞大的功能树去检索和拼接节点,比如「用户登录」「购物车管理」「支付处理」,像搭积木一样组合成完整蓝图。

这样,系统不但覆盖了所有关键功能,还能保证结构清晰、层次合理。

第二步:实现级构建

有了功能蓝图,还需要明确每个模块「落地到哪里」。

ZeroRepo 会把功能节点继续展开,写成具体的文件、接口和数据流,并一一标注进 RPG。以「支付处理」为例,它会被拆解成 payment_service.py、api / payment_api.py 等文件,并明确依赖订单与库存模块的输出。

这样,模块间的边界和依赖被牢牢固定,再也不会在生成过程中走偏。

第三步:图驱动生成

最后,ZeroRepo 按照 RPG 的拓扑顺序推进代码生成。每实现一个文件或函数,就会先生成测试用例,再写函数体,并把结果回写到 RPG 中。

这形成了「生成 — 验证 — 更新」的闭环。

整个过程像是沿着蓝图施工:有规划、有校验,仓库规模不断扩展,但始终保持接口对齐、结构稳定。

实证 ZeroRepo:从蓝图到真实仓库

为全面评估仓库级生成能力,他们构建了全新基准 RepoCraft。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

RepoCraft 评估准确性的任务的整体数据收集流程

不同于以往依赖现成仓库或提供详尽文档的设置,RepoCraft 不提供完整架构蓝图,还涵盖 6 个真实项目、共 1052 个任务:

scikit-learn,pandas,requests,django,statsmodels,sympy。

真正考察模型从模糊需求到结构化实现的能力。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

RepoCraft 基准上的不同智能体框架与模型性能对比(Gold Projects 代表真实世界的仓库)

功能覆盖与规模:覆盖率达 81.5%,比最强基线 Claude Code 高 27.3 个点;还能生成超 100 个新功能(创新率 11–13%),远超其他方法。生成仓库平均 36K 行代码、445K tokens,是 Claude Code 的 3.9 倍、其他方法的 64 倍,复杂度接近人工项目。

正确性与一致性:代码通过率为 69.7%,比 Claude Code 高 35.8 个点,接近人工项目上限(81%)。RPG 的结构化约束有效保证了模块边界和接口设计的一致性,使生成结果更稳定、更贴近设计初衷。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

ZeroRepo 利用 Qwen3-Coder-480B-A35B-Instruct 在机器学习库上搭建数据流动和函数依赖示意图

复杂依赖与协同:以 Qwen 3 Coder 生成的结果来看,RPG 不仅清晰组织了文件层次和模块流程,还显式捕捉了跨模块调用与反馈依赖,使复杂关系能够被稳妥管理,仓库在复杂度提升的同时仍保持整体协调。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

ZeroRepo 随规划迭代次数增长功能数量 (左图) 和代码数量增长情况 ZeroRepo 在功能数与代码规模上都展现出近乎线性的增长趋势。

随着迭代次数增加,RPG 引导的规划让新功能和新增代码能够稳步扩展,而不是像基线方法那样在早期就陷入停滞。这样的线性扩展能力证明他们具备支撑大规模仓库持续开发的潜力。

一举击败 Claude Code:微软提出代码生成黑科技,一键直出 36K 行代码

RPG 在智能体定位任务中的加速效果对比(wo / G 表示无全局信息)

此外,RPG 提供的全局结构视角显著提升了代理的仓库理解与定位能力,使其能够更快地追踪依赖、定位问题并完成模块集成,从而加速整个开发流程。


总结与展望

ZeroRepo 展示了结构化图谱在仓库生成中的独特价值:它不仅提升了功能覆盖率、代码规模和正确性,还解决了长期困扰自然语言规划的模糊与漂移问题,使自动化仓库生成首次逼近真实的软件开发过程。未来,研究团队计划进一步拓展 RPG 的适用范围,包括支持多轮需求变更下的交互式开发、跨仓库的协同演化,以及与现有工程工具链的深度融合。

参考资料:

https://arxiv.org/abs/2509.16198

来源:https://www.ithome.com/0/887/784.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
告别价格战中国车市迎来高质量发展新阶段

告别价格战中国车市迎来高质量发展新阶段

车市价格战正处微妙临界点。二季度起,一股与以往降价潮不同的涨价暗流开始酝酿。截至五月中旬,至少15家主流新能源品牌已释放调价信号,或直接涨价,或收紧优惠,涉及比亚迪、特斯拉、蔚来等传统及新势力车企。

时间:2026-05-23 10:19
谷歌上诉称搜索成功源于创新而非排他协议

谷歌上诉称搜索成功源于创新而非排他协议

谷歌就反垄断裁决提起上诉,辩称其市场地位源于产品创新与持续投资,而非排他协议。谷歌强调与苹果的默认搜索协议是商业自主选择,未损害竞争,用户可自行更改搜索引擎。上诉旨在撤销要求其开放数据、分发竞品结果的整改措施。

时间:2026-05-23 09:47
美股芯片股大涨中概股普跌 美联储加息概率升至70%

美股芯片股大涨中概股普跌 美联储加息概率升至70%

美股三大指数集体收涨,道指创历史新高。芯片股表现强势,费城半导体指数创新高,高通暴涨超11%。中概股普遍承压,纳斯达克中国金龙指数下跌。美联储新主席就任,市场预期加息概率升至70%,为未来增添变数。

时间:2026-05-23 09:46
中国电动汽车欧洲市场份额首次突破15%

中国电动汽车欧洲市场份额首次突破15%

今年4月,中国品牌电动汽车在欧洲市场销量占比首次突破15%,比亚迪、奇瑞等销量同比激增。凭借性价比与智能化优势,中国电动车加速渗透欧洲,插电混动份额近29%。同期中国新能源乘用车出口40 6万辆,同比增长111 8%,出口占比首超一半,欧洲、巴西等地增长显著,彰显全球竞争力持续提升。

时间:2026-05-23 09:46
小米Vision Gran Turismo概念车国内首秀亮相北京车展

小米Vision Gran Turismo概念车国内首秀亮相北京车展

2026年北京车展上,小米汽车展示了新一代SU7、即将发布的YU7GT及国内首秀的VisionGranTurismo概念车。新一代SU7市场表现强劲,续航与性能突出;YU7GT定位纯电GTSUV,强调高性能与操控;概念车则探索空气动力学与智能交互。小米汽车产品矩阵日趋完整,交付能力显著,正从行业新兵成长为具备体系竞争力的玩家。

时间:2026-05-23 09:14
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程