DeepSWE— Together.ai联合Agentica开源的AI Agent框架
发布时间:2025-07-15 编辑:游乐网
DeepSWE介绍
DeepSWE的核心功能代码理解与修改:能够解析并编辑现有代码,解决特定的软件问题或实现新功能。复杂问题处理:通过与环境的交互,解决如GitHub上的缺陷修复、新增功能实现以及调试等复杂的软件工程任务。自动化测试与验证:运行shell命令进行代码构建和测试,确保所提出的解决方案有效,并防止修改破坏原有功能。多阶段推理能力:在执行任务过程中具备多步骤推理和决策能力,逐步优化方案直至任务完成。DeepSWE的技术机制纯强化学习训练:完全采用强化学习(RL)从零开始训练,不依赖于监督微调(SFT)或更强的专有教师模型蒸馏。rLLM系统支持:利用rLLM框架进行后期训练,提供高效的数据管理与训练流程,支持大规模RL训练。稀疏奖励机制:仅当生成的代码补丁通过所有测试时才给予正向奖励,否则无奖励,促使模型追求高质量输出。测试时扩展策略(TTS):在测试阶段生成多个解决路径,并选择成功解决问题的路径,显著提升准确率。结合执行验证器与非执行验证器的优势,大幅提升性能表现。Kubernetes集成:为应对训练过程中的扩展挑战,集成了Kubernetes支持,实现容器的弹性调度与自动缩放,保障训练的高效与稳定。DeepSWE的项目链接HuggingFace模型库:https://www.php.cn/link/e04bc8909bb7969ae5488620e00f8c57DeepSWE的应用领域代码理解与重构:DeepSWE可自动分析并修改代码,快速定位漏洞、优化性能瓶颈及重构代码结构,从而显著提升代码质量。软件问题解决:能够高效处理GitHub上的各类问题、实现新功能并将复杂任务拆解为可执行的子任务,快速攻克各种软件难题。自动化测试与验证:DeepSWE可自动生成测试用例,执行代码构建与自动化测试,进行回归测试以确保软件稳定性,降低人工测试工作量。多阶段推理与方案优化:通过多步骤推理解决复杂问题,并不断迭代优化解决方案,在实践中积累经验,更好地应对未来挑战。开发辅助与团队协作:DeepSWE能为开发者提供实时代码建议与补全提示,协助项目管理和任务分配,促进团队合作与交流,提升整体开发效率。
deepswe是由together.ai与agentica联合推出的ai agent框架,基于qwen3-32b模型并通过强化学习训练构建。该框架在swe-bench-verified基准测试中表现优异,启用测试时扩展(tts)后准确率达到59.0%,未使用tts时pass@1准确率为42.2%,位居开源agent框架首位。该项目全面开源了模型训练数据、代码及评估日志,有助于开发者学习和优化agent技术,推动强化学习在软件工程领域的应用发展。

相关阅读
MORE
+- DeepSWE— Together.ai联合Agentica开源的AI Agent框架 07-15 AI学习网站有哪些_好用的AI学习网站大全 07-15
- 从「悟道」到「悟界」,智源走进大模型的新时代 07-15 AI训练模型有哪些_好用的AI训练模型大全 07-15
- Agent Zero— 开源可扩展AI框架,通过用户指令和任务动态学习 07-15 地平线RoboTransfer:几何一致视频世界模型,突破机器人操作泛化边界丨开发者说 07-15
- TradingAgents-CN— 中文多智能体金融交易决策框架 07-15 微软推出现代重制版 MS-DOS Edit 编辑器:Rust 语言编写 205KB 体积强调轻量、支持大文件处理 07-15
- AI聊天助手有哪些_好用的AI聊天助手工具大全 07-15 Deepseek 满血版 + ChatGPT Plugins,拓展 AI 应用功能边界 07-15
- 传苹果人工智能模型高管将跳槽至Meta 07-15 Furion— 基于.NET的免费开源AI开发框架 07-15
- 腾讯混元3D 2.1全链路开源,3D材质生成迈入“工业级”新阶段 07-15 AI编程工具有哪些_好用的AI编程工具大全 07-15
- mac命令行安装docker 07-15 易采集EasySpider— 开源AI可视化网络爬虫工具 07-15
- PromptForge— AI提示词工程平台,辅助构建有效提示和优化建议 07-15 mac命令行安装软件 07-15