当前位置: 首页
AI
DeepSWE— Together.ai联合Agentica开源的AI Agent框架

DeepSWE— Together.ai联合Agentica开源的AI Agent框架

热心网友 时间:2025-07-15
转载
DeepSWE介绍

deepswe是由together.ai与agentica联合推出的ai agent框架,基于qwen3-32b模型并通过强化学习训练构建。该框架在swe-bench-verified基准测试中表现优异,启用测试时扩展(tts)后准确率达到59.0%,未使用tts时pass@1准确率为42.2%,位居开源agent框架首位。该项目全面开源了模型训练数据、代码及评估日志,有助于开发者学习和优化agent技术,推动强化学习在软件工程领域的应用发展。

DeepSWE— Together.ai联合Agentica开源的AI Agent框架DeepSWE的核心功能代码理解与修改:能够解析并编辑现有代码,解决特定的软件问题或实现新功能。复杂问题处理:通过与环境的交互,解决如GitHub上的缺陷修复、新增功能实现以及调试等复杂的软件工程任务。自动化测试与验证:运行shell命令进行代码构建和测试,确保所提出的解决方案有效,并防止修改破坏原有功能。多阶段推理能力:在执行任务过程中具备多步骤推理和决策能力,逐步优化方案直至任务完成。DeepSWE的技术机制纯强化学习训练:完全采用强化学习(RL)从零开始训练,不依赖于监督微调(SFT)或更强的专有教师模型蒸馏。rLLM系统支持:利用rLLM框架进行后期训练,提供高效的数据管理与训练流程,支持大规模RL训练。稀疏奖励机制:仅当生成的代码补丁通过所有测试时才给予正向奖励,否则无奖励,促使模型追求高质量输出。测试时扩展策略(TTS):在测试阶段生成多个解决路径,并选择成功解决问题的路径,显著提升准确率。结合执行验证器与非执行验证器的优势,大幅提升性能表现。Kubernetes集成:为应对训练过程中的扩展挑战,集成了Kubernetes支持,实现容器的弹性调度与自动缩放,保障训练的高效与稳定。DeepSWE的项目链接HuggingFace模型库:https://www.php.cn/link/e04bc8909bb7969ae5488620e00f8c57DeepSWE的应用领域代码理解与重构:DeepSWE可自动分析并修改代码,快速定位漏洞、优化性能瓶颈及重构代码结构,从而显著提升代码质量。软件问题解决:能够高效处理GitHub上的各类问题、实现新功能并将复杂任务拆解为可执行的子任务,快速攻克各种软件难题。自动化测试与验证:DeepSWE可自动生成测试用例,执行代码构建与自动化测试,进行回归测试以确保软件稳定性,降低人工测试工作量。多阶段推理与方案优化:通过多步骤推理解决复杂问题,并不断迭代优化解决方案,在实践中积累经验,更好地应对未来挑战。开发辅助与团队协作:DeepSWE能为开发者提供实时代码建议与补全提示,协助项目管理和任务分配,促进团队合作与交流,提升整体开发效率。
来源:https://www.php.cn/faq/1388858.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

逼AI当山顶洞人!Claude防话痨插件爆火,网友:受够了AI废话

新智元报道编辑:元宇【新智元导读】一个让AI像原始人一样说话的插件,在HN上一夜爆火,冲破2w星。它的核心只是一条简单粗暴的prompt:删掉冠词、客套和一切废话,号称能省下75%的输出token。

时间:2026-04-07 14:55
季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

季度利润翻 8 倍,最赚钱的「卖铲人」财报背后,内存涨价狂潮如何收场?

AI 时代最赚钱的公司,可能从来不是做 AI 的那个。作者|张勇毅编辑|靖宇淘金热里最稳赚的人,从来不是淘金的,是卖铲子的。这句老话在 2026 年的科技行业又应验了一次。只不过这次卖铲子的不是英伟

时间:2026-04-07 14:49
Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claude Code Harness+龙虾科研团来了!金字塔分层架构+多智能体

Claw AI Lab团队量子位 | 公众号 QbitAI你还在一个人做科研吗?科研最难的,从来不是问题本身,而是一个想法从文献到实验再到写作,只能靠自己一点点往前推。一个人方向偏了没人提醒,遇到歧

时间:2026-04-07 14:43
让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

让离线强化学习从「局部描摹」变「全局布局」丨ICLR'26

面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大

时间:2026-04-07 14:37
美国犹他州启动新试点项目:AI为患者开具精神类药物处方

美国犹他州启动新试点项目:AI为患者开具精神类药物处方

IT之家 4 月 5 日消息,据外媒 PC Mag 当地时间 4 月 4 日报道,美国医疗机构 Legion Health 在犹他州获得监管批准,启动一项试点项目,允许 AI 系统为患者开具精神类药

时间:2026-04-07 14:30
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程