Meta提出推理新方法:训练AI记忆解题捷径,推理效率翻倍
Meta 在 AI 推理领域再次实现突破,找到了让大模型“思考更高效”的新方法。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
最新研究显示,Meta 团队开发出一种机制,能够帮助大型语言模型总结反复使用的推理过程,并将其转化为简洁指令——称为“行为(Behavior)”。
这项研究成果以《元认知复用:将重复的LLM推理转化为简洁行为》为题,于2025年9月17日由Meta与普林斯顿大学、蒙特利尔大学联合发表。

论文作者包括Aniket Didolkar、Nicolas Ballas、Anirudh Goyal和Sanjeev Arora。
论文链接:https://arxiv.org/abs/2509.13237
该方法的核心在于让大语言模型在完成推理后,能够识别并保存重复使用的计算步骤,形成简明的操作指南。
当遇到相似问题时,模型可以直接调用这些预设行为,无需重复推导过程。
实际测试结果令人惊喜。
在数学推理任务中,该机制使模型在保持准确率不变的情况下,推理所需的token数量最多降低了46%。
这意味着模型用不到一半的思考量,就能得出同样准确的答案。
研究团队将这一机制形象地描述为“思维缓存”,让模型学会记住自己的思考方式。
思维手册:AI的“行为记忆术”

“元认知复用”框架示意图
Meta 将这套系统命名为“行为手册”。
模型在解决问题时,会完整记录整个推理流程。
随后进行复盘分析,识别出常用的解题技巧,如“容斥原理”“分母有理化”“代入后化简”等。
模型会为这些技巧命名并编写说明,形成标准化的行为指令。
这些行为被收录在不断丰富的手册中,供后续调用。
研究将这一过程称为“元认知路径”,即模型对自己的思考方式进行反思和优化。
例如处理掷骰子概率问题时,模型可以直接调用behavior_total_outcomes(计算总可能结果)和behavior_inclusion_exclusion(应用容斥原理避免重复计数)等预设行为。
调用后即可快速得出答案,无需赘述推导过程。
每个行为都是一段高度压缩的思维过程,将原本需要数十步的推理浓缩为简洁指令。
实验数据显示,在MATH数据集上,行为调节推理使模型平均减少近一半的推理token;在AIME–24/25高难度数学题中,即使在有限的token预算(2048–8192)下,模型仍能保持稳定的准确率。
自我优化:像人类一样“节约思考”
传统大模型常被批评“过于啰嗦”——每解决一个问题都要完整展开所有中间步骤的思考链。
这不仅消耗大量token资源,也降低了模型的处理效率。Meta的新方法让模型学会自我反思、提炼精华、简化表达。

行为提取提示设计示意图
研究团队设计了三种工作模式:
首先是“行为调节推理”模式。模型从手册中调用相关行为提示来指导解题过程。结果显示,这种方法节省了46%的token使用量,同时准确率还有所提升。
其次是“行为引导自我改进”模式。模型使用自己总结的行为来优化后续推理。实践表明,这种方法的正确率比常规的“自我批改”提高了10%。
最后是“行为调节监督微调”模式。研究者使用带有行为提示的推理数据来训练学生模型,结果显示这些模型比传统微调版本表现更出色、效率更高。
实验采用R1-Llama-70B作为“元认知策略师”,并在Qwen3-32B、Llama-3.1-8B等多个学生模型上进行验证。
所有测试模型都表现出相同趋势:推理token数量显著下降,而性能保持稳定。
研究者将这一现象描述为:“模型从缓慢推导转变为快速反应。”它不再每次都重新构建思维过程,而是像人类一样,学会了利用经验来优化思考效率。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
三星连续七年稳居全球电竞显示器市场榜首
三星电子连续七年蝉联全球电竞显示器销量冠军,领跑高端游戏显示市场 三星电子在游戏显示领域的领先地位再次获得权威认证。根据国际数据公司(IDC)发布的《PC显示器季度追踪报告》显示,截至2025年,三星已连续第七年稳居全球电竞显示器品牌市场份额第一,占有率达18 9%。尤其在代表尖端显示技术的OLED
Intel CPU今年将暴涨30%!还好有AMD
2026年英特尔CPU价格大幅上调:开年三次调价,年度涨幅或达30% 进入2026年,PC硬件市场波澜再起。根据行业最新动态,英特尔在年初短短三个月内,已对其消费级处理器产品启动了多轮价格调整。市场分析指出,该公司计划中的全年整体涨幅,最终可能触及30%的惊人高位。 我们根据供应链权威信源梳理了具体
真“秉烛夜游”!省电天才用蜡烛驱动游戏机
秉烛夜“游”:当Game Boy遇上蜡烛动力 最近,海外博主Janus Cycle的一项创意实验在网络上引起了不小的关注——他竟然用一根蜡烛,成功驱动了一台经典的Game Boy游戏机,真正上演了一出现实版的“秉烛夜游”。只不过,这次“游”的是电子游戏。 先来感受一下这奇妙的场景: 下面这组截图,记
苹果尘封50年档案曝光:电路板比手机大 库克都没见过
苹果公司历史档案首次公开:揭秘历代经典产品背后不为人知的研发历程 为庆祝品牌成立50周年,苹果公司近期做出了一项特别举措:首席执行官蒂姆·库克首次对公司外的访问者开放了内部历史档案库,并展示了一批从未对外公布过的珍贵历史文件与实物原型。 此次档案公开本身传递出一个清晰的信号。库克在现场强调的核心观点
怎么连黑色款都没有!iPhone18Pro新配色登场
iPhone 18 Pro系列前瞻:设计、芯片与影像的确定性升级 进入下半年,科技圈的聚光灯,无疑将再次聚焦于苹果的年度旗舰。最新信息显示,iPhone 18 Pro系列的节奏已然清晰:计划于7月启动量产,并在9月如期亮相。与时间表一同明确的,是新机在配色、外观与核心硬件上将迎来的一系列关键调整。
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

