清华团队研发DeepPrune:为AI模型瘦身,提升推理效率新方法
在处理复杂问题时,人工智能系统通常采用并行推理策略——同时生成多条推理路径,从中筛选出最优解。但最新研究发现,这种看似高效的方法存在严重缺陷:超过80%的并行推理最终会得出相同结论,导致大量计算资源耗费在重复劳动上。这种现象如同30名学生解答同一道数学题,其中25人提交了几乎相同的解题步骤,仅有5人提供了差异化的解题思路。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
由清华大学与上海科技大学联合研发的DeepPrune技术,为解决该问题提供了创新方案。研究团队将AI推理过程比作果树生长,指出传统方法放任所有"枝条"自由生长,而DeepPrune则如同经验丰富的园丁,能在枝条发育早期识别出哪些会结出相同果实,从而精准修剪冗余枝条。实验数据显示,该方法可使计算资源消耗减少80%以上,部分场景下甚至达到91.6%的削减率。
研究团队选取DeepSeek-8B、Qwen3-4B等四种先进AI模型进行测试,要求每个模型针对数学和科学问题同时生成16个推理过程。结果显示,GLM-4.5-Air模型生成的推理对中,94.5%得出相同结论;即便是表现最佳的DeepSeek模型,也有76%的推理过程产生重复结果。这种普遍存在的冗余现象,促使研究团队开发专门的"推理相似度判断专家"。
该判断系统的训练过程颇具挑战性。研究团队从数学竞赛题库中选取758个问题,使用特定模型为每个问题生成16个推理路径,最终获得约8万对推理过程比较数据。为解决数据不平衡问题(相同结果样本占80%),团队采用"焦点损失"技术强化模型对困难案例的学习,同时运用"过采样"技术增加少数类样本数量。经过优化,判断系统的准确率达到87.01%,在控制误判率20%的情况下,仍能正确识别81.86%的差异化推理路径。
在实际应用中,研究团队设计了"贪心聚类"在线算法。当新推理过程生成时,系统会将其与现有"文件夹"中的内容进行相似度比对。若相似度超过阈值(设为0.5),则归入相应文件夹;若不匹配,则创建新文件夹。该算法通过限制最大文件夹数量(32个)和随机选取代表性样本(最多10个)进行对比,既保证了判断效率,又避免了过度修剪。最终答案采用多数投票制,从包含最多相似推理的文件夹中选取样本完成推理。
实验验证环节,研究团队在AIME 2024、AIME 2025和GPQA三个竞赛数据集上,对DeepSeek-8B、Qwen3-32B和GPT-OSS-20B三种模型进行测试。与传统"生成512个推理过程后投票"的方法相比,DeepPrune在保持准确率相当的情况下,计算量显著减少。特别是在Qwen3-32B模型处理AIME 2025问题时,计算量削减91.4%的同时,准确率从80%提升至90%。与基于置信度的早停方法DeepConf相比,DeepPrune在计算量减少和准确性维持方面均表现更优。
技术细节方面,研究团队发现采用"推理步骤对齐"的截取方法(基于"因此""所以"等逻辑标志词)比简单固定长度截取更有效,准确率提升1.45个百分点。消融实验证实,焦点损失与过采样技术的组合使用至关重要,单独应用任何一种技术都无法达到最佳效果。相似度阈值设置为0.5时,系统能在效率提升与答案多样性间取得良好平衡。
尽管DeepPrune展现出显著优势,研究团队也指出其局限性。当前判断系统仅在特定模型推理数据上训练,对差异较大的模型架构适应性有待验证;贪心聚类算法可能因早期相似性判断失误而导致局部最优决策;判断专家自身的计算开销在简单推理任务中占比可能较高;相似度阈值需根据具体任务调整,增加了系统部署复杂度。这些发现为后续研究指明了改进方向。
对普通用户而言,该技术意味着未来移动设备可能运行更强大的AI助手,在线服务响应速度将显著提升。在科研领域,药物设计、工程优化等需要大量并行推理的任务,将因计算效率提升而加速突破。技术细节可查阅论文编号arXiv:2510.08483v1的完整研究报告。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点
OpenClaw 是什么?OpenClaw 详细使用教程及中转 API 优缺点分析 最近,圈子里的讨论热度明显聚焦在一个词上:OpenClaw。无论是开发者,还是正在推进AI项目的团队,都在打听它。这工具到底是什么?能解决什么问题?配上那些中转Token,真的就高枕无忧了吗?今天,我们就来把这事儿掰
OpenClaw教程(八)—— 为OpenClaw打造记忆系统
上一篇我们探讨了OpenClaw的自动化能力,今天的话题,可以说是一个AI助手能否真正“进化”的关键——如何为它构建一套有效的记忆系统。 随着助手能力的不断扩展,它每天处理的事务会越来越多,产生的信息量也会急剧增长:例行检查、异常发现、你下达的各种指令……如果没有记忆,每次唤醒它都如同面对一张白纸,
OpenClaw创建 Skills
SKLL md 在构建AI助手自定义技能的过程中,一个基础的“打招呼”功能看似简单,却是理解整套开发流程的绝佳入口。这个名为 hello_world 的技能模板,完整展示了一个规范的技能描述文件应如何构成,是所有复杂功能开发的基石。 ---name: hello_worlddescription:
让 AI 替你叫车,哈啰顺风车上线出行行业首个 MCP 服务
让 AI 替你叫车:哈啰顺风车上线出行行业首个 MCP 服务 4月3日,哈啰顺风车推出一项业内瞩目的创新举措:正式上线名为MCP的新型服务。通俗来讲,这项服务将顺风车从寻找车主、智能匹配到最终下单支付的完整流程能力,封装成了一套标准化的技术接口,直接向各类大语言模型和AI智能体开放调用权限。 这一变
QQ接入openclaw的几个步骤
2026年4月新版OpenClaw QQ机器人接入全攻略:实践步骤、问题排查与深度解读 随着2026年4月OpenClaw重要更新的发布,其原生集成QQ平台支持的功能引起了大量开发者的关注。这一特性意味着用户无需借助任何第三方插件,即可将智能AI助手便捷地部署为QQ私聊或群聊机器人。本文将系统性地解
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

