AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!
图片大家好,我是 ai 学习的老章
之前推荐过 N 多读论文神器,比如可以用大模型下载论文、总结论文,效率飞起的 ArXiv MCP 服务器、整篇翻译并保留样式的看论文神器,一键翻译,体验很爽、还有最近刚刚分享的斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、翻译,效率飙升100倍!的 AlphaXiv
今天再推荐一个更强大的,可以复现机器学习论文代码的工具——Paper2Code
开源代码不支持 DeepSeek ,稍作修改就可以使用 DeepSeek API 了
https://arxiv.org/pdf/2504.17192https://arxiv.org/pdf/2504.17192
一句话总结,PaperCoder 旨在通过利用大型语言模型(LLM)在多代理系统中直接从机器学习研究论文中生成完整的、可执行的代码库。
PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库
顶级机器学习会议的分析表明,只有一小部分被接受的论文提供了相应的代码:
在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码
PaperCoder 通过将研究库生成形式化为软件开发问题来解决可重复性挑战。
该框架可以表示为 M(R) = C,其中:
R 是包含方法和算法的研究论文C 是生成的代码库M 是执行转换的基于 LLM 的模型该系统采用三阶段方法,该方法反映了人类的软件开发过程:
规划阶段:创建高级路线图,包括架构设计(类图和序列图)、文件依赖关系识别和配置文件生成。分析阶段:对每个文件和函数进行细粒度的解释,分析输入、输出、交互和算法约束。生成阶段:根据规划期间确定的执行顺序合成整个代码库。每个阶段都使用专门的 LLM 代理来实现,这些代理协同工作以完成任务,这使得 PaperCoder 成为一个复杂的多代理系统。
图片效果怎么样呢?
PaperCoder 的性能优于软件开发工作基线,如 ChatDev 和 MetaGPT,表明其专门设计的有效性。
作者与专家(包括原始论文作者)进行了评估,以评估生成代码的质量。结果显示:
PaperCoder 生成的存储库中有 77% 被人类评估者评为最佳85% 的人类评审员报告说生成的存储库很有帮助
图片如何使用呢?
图片安装
代码语言:javascript代码运行次数:0运行复制pip install openaiexport OPENAI_API_KEY="登录后复制"git clone https://github.com/going-doer/Paper2Codecd Paper2Codegit clone https://github.com/allenai/s2orc-doc2json.gitcd scriptsbash run.sh
输出结果如下
代码语言:javascript代码运行次数:0运行复制outputs├── Transformer│ ├── analyzing_artifacts│ ├── coding_artifacts│ └── planning_artifacts└── Transformer_repo # Final output repository登录后复制
系统的工作流程是:
将 PDF 论文转换为 JSON 格式 0_pdf_process.py:4-17分析论文内容并生成实现计划 1_planning.py:26-36进行逻辑分析 2_analyzing.py:49-54生成代码实现 3_coding.py:43-50
图片不过这个项目是默认 OpenAI 的 api,本地运行也只支持 vllm 拉起的模型。
我看了一下,其实该起来也非常简单
比如把 OpenAI 切换为 DeepSeek,需要修改的脚本不多
修改 API 客户端初始化和调用:
codes/1_planning.py - 规划生成组件 1_planning.py:1-16codes/2_analyzing.py - 逻辑分析组件 2_analyzing.py:1-20codes/3_coding.py - 代码生成组件 3_coding.py:1-19把
代码语言:javascript代码运行次数:0运行复制client = OpenAI(api_key = os.environ["OPENAI_API_KEY"])登录后复制
修改为下面即可
代码语言:javascript代码运行次数:0运行复制client = OpenAI(api_key = os.environ["OPENAI_API_KEY"],base_url="https://api.siliconflow.cn/v1")登录后复制
如果你用的是 DeepSeek 最新 API,base_url 改为 https://api.deepseek.com_/v1
其他类似
然后修改scripts/run.sh中的环境变量设置: run.sh:1-3
代码语言:javascript代码运行次数:0运行复制export OPENAI_API_KEY="sk-XXXXXX"GPT_VERSION="deepseek-ai/DeepSeek-R1"登录后复制
然后就全部 ok
最后推荐一个我正在学习的Cusor快速入门与实战
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
小米17 Max续航实测 8000mAh电池续航远超iPhone 17 Pro Max
小米17Max将于5月21日发布,其核心亮点包括内置8000mAh超大电池,续航表现突出。实测连续视频播放超33小时,远超两台iPhone17ProMax接力时长。该机还配备6 9英寸超级像素屏,显示细腻且功耗低,并首发2亿像素徕卡主摄及独立3X潜望长焦,影像能力全面升级。
三星Note10+自动重启原因与解决方法
三星Note10+手机自动重启可能由手机壳挤压电源键、极端温度、系统缓存过多、SD卡故障或定时开关机设置引起。可依次排查这些因素。若问题依旧,可尝试通过刷机修复系统软件故障。若刷机无效,则可能是硬件问题,需送交专业维修中心处理。
安卓手机存储涨价致售价上涨近20% 用户换机周期延长
存储芯片涨价导致安卓手机成本上升,东南亚市场一季度出货量下滑9%,平均售价却同比上涨19%至349美元。三星逆势增长,OPPO、小米出货量均下降。全球主要市场均受波及,终端价格上涨致消费者推迟换机,市场复苏前景不明。
一加手机线刷救砖教程 一加X与一加2刷机指南
本教程以金立N5120为例,详细介绍了使用线刷宝进行线刷的完整步骤:下载客户端与对应ROM包,连接手机后开启USB调试、安装驱动并进入刷机模式,等待进度条完成。刷机成功后手机会自动重启,首次开机时间可能较长。整个过程需严格遵循步骤并使用正确资源。
小米8屏幕指纹版刷机教程 全网通8GB内存刷机步骤详解
以小米8屏幕指纹版为例,介绍使用线刷宝进行刷机的步骤。需下载高版本ROM包,通过USB连接电脑并开启调试模式,软件将引导完成驱动安装与刷机操作。刷机成功后需检查各项功能是否正常。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

