数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

无需训练：即插即用的解码方法提升模型思考能力

无需训练：即插即用的解码方法提升模型思考能力

热心网友时间：2026-02-23

转载

你有没有发现这样一种现象：面对同一个问题，大模型可能在每次回答时都给出不同答案。一个不容忽视的问题是，这种不确定性，是否意味着推理仍不稳定？

随着技术的发展，大模型在自然语言处理和多模态任务中已经表现出越来越强的性能。传统解码策略主要包括随机采样（random sample）和贪婪解码（greedy decoding）。例如，ChatGPT、Claude、Gemini 等大模型默认的是随机采样（random sample），即便是回答相同的问题，它们可能每次都会给出不同的答案。

而贪婪解码（greedy decoding）在一般的基准测试（benchmark）上表现会有所提升，特别是在推理性任务上。但是，模型在不确定情况下的表现仍不理想。

为解决上述问题，美国东北大学与 Adobe、美国凯斯西储大学联合团队提出了一种无需训练的新型解码策略，名为“谨慎下一步预测（CNTP，Cautious Next Token Prediction）”。

该策略旨在通过在模型不确定性高的步骤采样多个候选路径，并选择困惑度最低的路径。相较于随机采样和贪婪解码等传统策略，CNTP 显著提升了大模型在多种任务上的推理准确度，可应用场景包括语音助手、视觉助手、聊天机器人等。

图丨相关论文（来源：arXiv）

“我们的研究证明了 Transformer 模型下一个词元预测（next token prediction）的范式，有可能实现真正的智能。”该论文第一作者王亦周对 DeepTech 表示。他目前正在东北大学攻读博士学位，主要研究方向包括大模型、多模态模型和计算机视觉，即将加入 Adobe 担任研究科学家/工程师。

图丨王亦周（来源：王亦周）

Safe Superintelligence 公司创始人、前 OpenAI 首席科学家伊尔亚·苏茨克维（Ilya Sutskever）曾公开表示，如果模型足够强大，对下一个 token 的预测能力可能反映对世界的某种理解，这可能是实现更深层智能的关键路径。

也就是说，next token prediction 是智能的核心。要实现这一点，需要在模型内部进行强推理，再通过一系列计算预测下一个 token。

受此启发，研究团队从人类认知行为中寻找灵感：人在思考时，往往越谨慎回答，结果的准确率越高，那么大模型会不会也和人脑有类似的机制？

王亦周解释道：“这种过程类似于我们在参加考试时的解题过程，我们可能会先想下有哪些解法，然后从中挑选一种认为最有把握的方法，确认无误后再进行下一步，直到得到完整的证明。”

图丨 CNTP 方法概述（来源：arXiv）

这里的谨慎指的是，当面对不确定性的情况，需要多尝试几条不同的路径，然后选择一条最稳妥、最可信的路径。

研究团队用熵作为模型不确定性的衡量标准：熵越高越不可信。在自然语言处理（NLP）中，困惑度（perplexity）越低代表对答案越可信。因此在 CNTP 策略下，一旦熵值较高，模型会采样多个候选路径，并选择其中困惑度最低的一条，再一步步迭代。

研究人员通过消融研究证明，由于思维链推理的回答往往较长，每条路径长度也不同，如果算完整评估的困惑度无法很好地衡量答案的可靠性。基于此，他们采取了每到一句话的标点符号截止的方式来计算困惑度。相当于每句话、每个小的推理单元，即每个局部自洽能够实现较理想的效果。

为控制采样次数，研究团队通过设置最小熵 Hmin 和最大熵 Hmax 两个阈值和最大试验次数 Nmax。该方法在提高解码准确性的同时，还有效地限制了计算成本，避免了在每个步骤大量采样而带来的高计算开销。

（来源：arXiv）

在实验验证方面，该团队在数学推理（GSM8K、MATH）、常识推理（StrategyQA）和开放问答（TruthfulQA）等任务中证明，与包括贪婪解码、随机解码和束搜索在内的传统方法相比，CNTP 策略的结果更具优势。

例如，在 TruthfulQA 任务中，Llama-2-7B 在使用 CNTP 方法后，真实性准确率提升到了 84.8%，相较于随机解码提升 6.8%。

值得关注的是，CNTP 策略无需训练，仅解码即可直接实现提升性能。王亦周解释道：这种方法在某种程度上像“免费午餐”，尽管可能会带来更多的 token 消耗，但在实际应用中有很多优化的方法可解决该问题。

（来源：arXiv）

此外，该方法搭配自一致性（self-consistency）后，可进一步提升性能（注：自一致性是取多个样本，然后选一个出现频率最高的答案），且计算成本远低于后者。原因在于，利用多样性和随机性集思广益后，选取多数投票。

研究团队证明，每个样本也是越谨慎越好。“我们的方法会在一定程度上限制它的多样性，但通过调高温度可以解决这一点，所以它能进一步提升。”王亦周说。

此外，CNTP 策略具有较好的普适性，可用于广泛的对话任务。除了有固定答案的数学题或代码题，它也可以用于开放式问题，研究团队未来将尝试将该策略用于图像或视频生成。

该研究为大模型的推理优化提供了一种新思路，有望成为下一代解码策略的重要候选方案。

参考资料：

1.相关论文：https://arxiv.org/abs/2507.03038v2

2.code link：https://github.com/wyzjack/CNTP

排版：刘雅坤

来源:https://www.163.com/dy/article/KMFRHOVK05119734.html

上一篇：宝马7系L3辅助驾驶暂停：功能受限与需求不足解析

下一篇： AI引爆存储革命：NAND闪存迎来黄金三年新周期

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

Swissbit N7000嵌入式SSD采用自封NAND与自研主控固件

Swissbit N7000嵌入式SSD采用自封NAND与自研主控固件

近日，欧洲领先的工业级存储解决方案提供商Swissbit，正式发布了其全新一代嵌入式固态硬盘产品线——N7000系列。该系列产品的核心亮点在于实现了从闪存颗粒到主控固件的全链路关键技术整合：不仅采用了Swissbit自主封装的NAND闪存，更首次搭载了其自研的PCIe Gen4 NVMe主控芯片及配

时间：2026-05-20 22:41

iQOO 15T首发天玑9500 Monster版性能解析与价格速览

iQOO 15T首发天玑9500 Monster版性能解析与价格速览

iQOO15T性能旗舰手机首发天玑9500Monster版芯片，配合帧内感知调度技术，性能与稳帧表现显著提升。其配备8K冰穹VC散热系统与寰宇电竞网络2 0，保障高强度使用体验。手机搭载8000mAh超薄电池与100W闪充，支持边充边用且减少电池损耗。屏幕采用2K144HzLTPO技术，实现清晰护眼流畅的视觉体验。

时间：2026-05-20 22:40

SpaceX上市最新进展谷歌或成最大外部受益者

SpaceX上市最新进展谷歌或成最大外部受益者

SpaceX即将上市，估值或达1 75万亿至2万亿美元，有望创下全球最大IPO纪录。公司凭借火箭发射主导地位及星链业务高速增长支撑高估值。早期投资者如D1资本、达尔萨纳资本回报丰厚，Alphabet作为重要股东持股价值约875亿美元。创始人马斯克保持控制权，员工期权池亦价值巨大。上市进程已进入最后阶段。

时间：2026-05-20 22:39

武汉发布首款家庭通用机器人可叠衣做饭收拾餐桌

武汉发布首款家庭通用机器人可叠衣做饭收拾餐桌

全国首款面向家庭环境的通用型服务机器人正式发布。5月20日，在武汉光谷，一款名为“拾光 S1”的智能家用机器人揭开面纱。该机器人致力于解决多样化的家庭事务，涵盖衣物整理、餐食准备、餐桌清理以及老人陪伴交流等场景，并具备持续学习与技能升级的成长能力。它完全不同于传统工业流水线上按固定程式作业的机械臂

时间：2026-05-20 22:07

南京江北新区低空经济乘风而上逐梦未来

南京江北新区低空经济乘风而上逐梦未来

江阴大桥的巡检工作，过去需要一支20人的团队，耗费整整两个月才能完成。如今，这项任务只需一人，十天就能全部搞定。效率发生如此碘伏性提升，秘密在于给无人机装上了“智慧大脑”——这正是南京韦博智控科技有限公司带来的变革。而这，仅仅是南京江北新区在低空经济浪潮中乘风起飞的一个缩影。在这里，低空不再仅仅是

时间：2026-05-20 22:06

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

漫蛙漫画防走失网页链接

2026年烈焰觉醒真实礼包码免费领取永久兑换

星之破晓4GB运行内存能流畅玩吗游戏配置要求详解

Wizardry Variants Daphne官网地址与游戏攻略指南

0.1折手游超越黎明清凉版官方正版下载

星之破晓集卡活动参与方法与玩法全攻略

小小仙王清凉版官方下载免费获取正版安装包

星之破晓星魂战场位置与玩法全攻略

幻界之境最新兑换码大全免费领取全部礼包码

乱涂彩世界游戏需要多大内存空间

漫蛙漫画防走失网页链接

盗宝小妖高分通关攻略与实战技巧详解

魔兽世界凄凉之地前往路线与交通指南

无限火力剑魔最强出装符文搭配攻略

和平精英最新版更新教程卡顿下载慢解决方法汇总

DNF皇女艾莉婕身份背景与剧情详解

梦幻西游东海湾蜃境入口选择攻略与路线推荐

魔兽世界巫妖王怀旧服裁缝专业速冲450级指南

DNF女枪手职业推荐：哪个职业最强最好用

三角洲行动M82狙击枪改装方案配件搭配与实战技巧

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

边境检察官steam售价与中文名全解析

边境检察官steam售价与中文名全解析发布于 2026-05-20

第五人格5月21日更新维护公告内容详解

第五人格5月21日更新维护公告内容详解发布于 2026-05-20

偃武XP赛季活动福利全解析与领取指南

偃武XP赛季活动福利全解析与领取指南发布于 2026-05-20

狂发疯杰克游戏值得玩吗玩法特色与上手攻略详解

狂发疯杰克游戏值得玩吗玩法特色与上手攻略详解发布于 2026-05-20

铁锈战争新手入门指南与实战玩法攻略

铁锈战争新手入门指南与实战玩法攻略发布于 2026-05-20

螺旋圆舞曲2全角色攻略指南解锁所有可攻略人物方法

螺旋圆舞曲2全角色攻略指南解锁所有可攻略人物方法发布于 2026-05-20

我本千金伙伴培养全攻略从入门到精通指南

我本千金伙伴培养全攻略从入门到精通指南发布于 2026-05-20

台球风云游戏玩法介绍与上手体验评测

台球风云游戏玩法介绍与上手体验评测发布于 2026-05-20

三国志战略版PVP盾兵阵容搭配攻略

三国志战略版PVP盾兵阵容搭配攻略发布于 2026-05-20

2026年热门二战游戏推荐人气战争题材游戏下载合集

2026年热门二战游戏推荐人气战争题材游戏下载合集发布于 2026-05-20

2026年热门手游实名认证指南与必玩游戏推荐

2026年热门手游实名认证指南与必玩游戏推荐发布于 2026-05-20

洛克王国手游PVP最强阵容搭配攻略

洛克王国手游PVP最强阵容搭配攻略发布于 2026-05-20

排兵布阵游戏预约开启参与活动赢取黄金奖励

排兵布阵游戏预约开启参与活动赢取黄金奖励发布于 2026-05-20

霍格沃茨之遗阿瓦达索命咒学习方法与获取全攻略

霍格沃茨之遗阿瓦达索命咒学习方法与获取全攻略发布于 2026-05-20

异星之地星空三十一区5月25日开服

异星之地星空三十一区5月25日开服发布于 2026-05-20

2026年热门小羊羊游戏推荐合集与玩法分享

2026年热门小羊羊游戏推荐合集与玩法分享发布于 2026-05-20

Windows批量修改文件后缀名教程使用CMD命令一键快速完成

Windows批量修改文件后缀名教程使用CMD命令一键快速完成发布于 2026-05-20

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力发布于 2026-05-20

如何查询Mac型号年份与配置信息

如何查询Mac型号年份与配置信息发布于 2026-05-20

Linux系统Nginx服务器HTTPS证书安装配置教程

Linux系统Nginx服务器HTTPS证书安装配置教程发布于 2026-05-20

Mac放大镜功能开启指南轻松看清屏幕细节

Mac放大镜功能开启指南轻松看清屏幕细节发布于 2026-05-20

Mac终端清理DNS缓存详细步骤与操作指南

Mac终端清理DNS缓存详细步骤与操作指南发布于 2026-05-20

Win11任务栏合并标签如何关闭恢复经典文字导航栏

Win11任务栏合并标签如何关闭恢复经典文字导航栏发布于 2026-05-20

Mac桌面图标自动整理技巧：堆栈功能高效管理文件

Mac桌面图标自动整理技巧：堆栈功能高效管理文件发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集