Google研究:简单重复提示词大幅提升大模型准确性
来自 Google Research 的一项新研究发现了一个简单却格外有效的提示词技巧:只需把问题复制粘贴再说一遍,就能显著提升大语言模型在非推理任务上的准确率。实验中,Gemini、GPT-4o、Claude 和 DeepSeek 等主流模型的准确率从 21.33% 飙升至 97.33%,最高提升幅度达到 76 个百分点。这个简单的技巧颠覆了以往复杂的提示工程实践,像是“思维链”、“多样本学习”等方法,而且几乎不影响模型生成内容的速度。
研究人员对七个常见基准测试和七种主流大模型进行了对比,他们发现“提示词重复”策略在70组正面测试中赢了47组,可以说表现全优。尤其在需要从长篇大论中精确检索信息的任务上,效果提升非常明显。例如,在“NameIndex”测试中,Gemini 2.0 Flash-Lite 的准确率就从 21.33% 提升到了惊人的 97.33%。
这一现象背后的原理与 Transformer 模型的“因果盲点”有关。这类模型会按照从左到右的顺序处理文本,无法“回头再看”,这导致了信息处理存在天然的缺陷。而“提示词重复”就像是为模型打了一个“补丁”,让第二次阅读获得了类似“上帝视角”的注意力效果,从而能更准确地对齐任务所需的上下文信息。
此外,这项技巧几乎不会增加延迟时间。因为大语言模型在处理信息的预填充阶段具有高度并行性,凭借现代 GPU 的强大算力,即便输入内容翻倍,用户也几乎察觉不到速度上的差异。这意味着开发者无需升级到更庞大、更昂贵的模型,就能实现高准确率的检索和抽取任务。
不过,这种“复读机”策略主要适用于非推理任务,对于那些需要逐步推导逻辑的场景效果有限。在安全方面,重复可能会放大某些指令的显著性,其对越狱成功率的影响尚需专门实验来验证。同时,防护方也可以利用这一机制,通过在系统提示词开头重复安全规则,来增强模型对安全约束的注意力。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
联想IdeaPad Slim 5i轻薄本发布 新款笔记本性能与便携兼备
联想推出新款轻薄本IdeaPadSlim5i,搭载英特尔最新处理器,配备15英寸高刷新率屏幕。机身采用铝合金材质,提供两种电池容量选择,接口齐全且支持PD快充。整机重约1 49公斤,便于携带,具体售价和上市时间尚未公布。
嫦娥七号下半年发射计划公布 后续将开展梦舟飞船揽月着陆器首飞任务
中国深空探测战略升级,载人航天与嫦娥工程整合为“月球探测工程”。长征十号火箭与梦舟飞船完成关键试验,为可重复使用天地往返系统奠定基础。嫦娥七号探测器计划下半年发射,将对月球南极进行综合探测。后续将验证梦舟飞船与揽月着陆器,全力推进2030年前实现载人登月目标。
苹果A3577认证曝光 预计为Beats新款蓝牙头戴耳机
一款型号为A3577的苹果蓝牙头戴式耳机在FCC认证文件中曝光,具体规格与设计尚未披露。外界猜测其可能属于Beats系列,例如即将更新的StudioPro迭代产品,主要依据是该系列产品已近三年更新周期,市场期待其在音质与降噪等方面有所提升。
告别价格战中国车市迎来高质量发展新阶段
车市价格战正处微妙临界点。二季度起,一股与以往降价潮不同的涨价暗流开始酝酿。截至五月中旬,至少15家主流新能源品牌已释放调价信号,或直接涨价,或收紧优惠,涉及比亚迪、特斯拉、蔚来等传统及新势力车企。
谷歌上诉称搜索成功源于创新而非排他协议
谷歌就反垄断裁决提起上诉,辩称其市场地位源于产品创新与持续投资,而非排他协议。谷歌强调与苹果的默认搜索协议是商业自主选择,未损害竞争,用户可自行更改搜索引擎。上诉旨在撤销要求其开放数据、分发竞品结果的整改措施。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

