ICML 2026研究揭示大模型仅需少量思考令牌即可实现深度推理

Chain-of-Thought(CoT,思维链)推理,已成为当前大语言模型解决复杂问题的核心范式。它通过引导模型将推理步骤逐步显式化,显著提升了在数学、逻辑等任务上的表现。
然而,这种“显式思考”模式也带来了显著的效率瓶颈。模型需要生成海量的中间过程文本,每一个额外的token都直接增加了推理延迟、消耗了宝贵的显存,并推高了计算成本。尤其是在处理多模态任务时,模型往往需要先耗费大量篇幅描述图像、总结问题上下文,最后才进行关键推导。这个过程虽然提升了可解释性,但其背后的计算开销却不容忽视。
这引发了一个深刻的思考:大模型的“推理过程”,是否必须完全以人类可读的长文本形式呈现?是否存在一种更高效、更本质的推理实现方式?
近期,来自浙江大学、Adobe Research和杜克大学的研究团队提出了一项创新解决方案。他们设计了一个面向多模态大模型的高效推理框架——Heima。该方法的核心创新在于,将原本冗长的文本思维链,压缩为一系列高度抽象的“思维令牌”(thinking tokens)。模型无需将每一步思考都“说”出来,而是在一个隐式的内部空间中完成高效的推理演算。
实验结果表明,这一方法能大幅减少生成token的数量,同时最大限度地保留CoT带来的性能增益。更深入的是,研究者尝试使用一个纯语言模型作为“解释器”,对这些抽象的思维令牌进行解码与重构。研究发现,这些内部令牌确实编码了可被还原、可被分析的逻辑推理链,从而为模型的“隐式思考”黑箱打开了一扇可解释的窗口。
这项名为《Efficient Reasoning with Hidden Thinking》的研究工作,已被机器学习顶级会议ICML 2026接收。

论文标题:Efficient Reasoning with Hidden Thinking
方法名称:Heima
会议:ICML 2026
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
OpenClaw自动化内容创作系统使用指南与优势解析
当您搭建端到端自动化内容创作流程时,如果遇到OpenClaw框架无法正常生成内容、格式化文档或执行发布任务的情况,问题根源通常集中在几个核心环节。模型连接异常、关键技能模块失效、浏览器自动化环境故障或记忆索引损坏,都可能导致整个工作流中断。无需担忧,这类系统性问题大多可以通过结构化排查来解决。遵循以
豆包AI专属模型训练步骤详解
训练豆包AI专属模型需遵循五个步骤。首先准备与业务相关的高质量数据,并进行清洗、标注与划分。随后在平台配置环境,选择基础模型并上传数据。接着启动微调训练,关注指标变化。完成后将模型部署为API服务,配置访问权限与限流。对于问答场景,可采用知识库增强的轻量训练方式,快速生效。
YC开源GBrain八层架构打造个人AI第二大脑解决记忆难题
YC总裁开源GBrain项目,旨在解决大模型长期记忆缺失问题。该项目采用八层架构,不仅强化检索能力,更通过认识论层、实体知识图谱和梦境循环等设计,实现信息的溯源、关联与自主整合进化。相比传统RAG,GBrain在测试中展现出显著性能提升,被视为构建“AI第二大脑”的重要探索,有望提升个人生产力。
腾讯AI平台吐司上线 一键生成App原型预览
腾讯推出AI应用生成平台“吐司”,用户通过自然语言描述创意,AI即可自动生成应用原型并打包为APK文件。平台提供创作、分享、灵感交流与搜索四大功能,旨在降低门槛,鼓励用户实现灵感并进行二次创作,构建从创意到原型的闭环社区生态。
arXiv新规严禁AI代写论文 署名作者将连带受罚
arXiv平台出台新规,严惩利用生成式AI制造低质量论文的行为。若发现论文中存在AI生成的未核查内容或虚假引用,所有署名作者将被封禁一年,解封后投稿需先通过期刊评审。新规强调签名即担责,旨在遏制学术不端。陶哲轩对此表示支持,认为加强学术消化环节至关重要。此举回应了AI生成论文泛滥。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

