当前位置: 首页
AI
DeepSeek-R1推理原理:谷歌研究揭示模型角色辩论机制

DeepSeek-R1推理原理:谷歌研究揭示模型角色辩论机制

热心网友 时间:2026-01-26
转载





编辑|张倩、陈陈

过去两年,大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上,推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B,开始稳定拉开与传统指令微调模型的差距。直观来看,它们似乎只是思考得更久了:更长的 Chain-of-Thought、更高的 test-time compute,成为最常被引用的解释。

但如果把问题继续往深处追问:推理能力的本质,真的只是多算几步吗?

谷歌、芝加哥大学等机构的研究者最近发表的一篇论文给出了一个更具结构性的答案,推理能力的提升并非仅源于计算步数的增加,而是来自模型在推理过程中隐式模拟了一种复杂的、类多智能体的交互结构,他们称之为「思维社会」(society of thought)。

简单理解就是,这项研究发现,为了解决难题,推理模型有时会模拟不同角色之间的内部对话,就像他们数字大脑中的辩论队一样。他们争论、纠正对方、表达惊讶,并调和不同观点以达成正确答案。人类智能很可能是因为社交互动而进化的,而类似的直觉似乎也适用于人工智能!



通过对推理输出进行分类,以及结合作用于推理轨迹的机制可解释性方法,研究发现,诸如 DeepSeek-R1 和 QwQ-32B 等推理模型,相较于基线模型和仅进行指令微调的模型,展现出显著更高的视角多样性。在推理过程中,它们会激活更广泛、异质性更强的、与人格和专业知识相关的特征,并在这些特征之间产生更充分的冲突。

这种类多智能体的内部结构具体表现为一系列对话式行为,包括提问 — 回答序列、视角切换以及对冲突观点的整合;同时还体现在刻画激烈往返互动的社会情绪角色之中。这些行为通过直接与间接两种路径,共同促进了关键认知策略的运作,从而解释了推理任务中准确率优势的来源。

进一步的受控强化学习实验显示,即便仅以推理准确率作为奖励信号,基础模型也会自发地增加对话式行为;而在训练中引入对话式脚手架(conversational scaffolding),相较于未微调的基础模型以及采用独白式推理微调的模型,能够显著加速推理能力的提升。

这些结果表明,思维的社会化组织形式有助于对解空间进行更高效的探索。谷歌认为,推理模型在计算层面建立了一种与人类群体中的集体智能相对应的机制:在结构化的条件下,多样性能够带来更优的问题求解能力。

基于此,谷歌提出了通过智能体组织形式来系统性利用「群体智慧」的新研究方向。



论文地址:https://arxiv.org/pdf/2601.10825

同时,这一研究也给社区提供了一些启发。



方法概览

对话行为

本研究采用以 Gemini-2.5-Pro 模型作为评估器的方法,从推理轨迹中识别出四类对话行为:

1. 问答行为:指对话中先提出问题后给出回答的语列,例如「为什么……?因为……」「倘若…… 会怎样?那么……」

2. 视角转换:指对话过程中切换至新的想法、观点、假设或分析方法的行为。

3. 观点冲突:指表达出与其他观点不一致、纠正对方观点或观点间存在矛盾张力的情况,例如「等等,这肯定不对……」「这与…… 相矛盾」。

4. 观点调和:指将存在冲突的观点整合或梳理为连贯结论的情形,例如 「因此,若满足…… 条件,或许两种观点都成立」「结合这些见解……」以及「这就化解了观点间的矛盾……」

针对每条推理轨迹,大语言模型评估器会统计各类会话行为的独立出现次数,输出整数计数结果(无对应行为时计为 0)。

在这四类会话行为的标注上,Gemini-2.5-Pro 与 GPT-5.2 的结果展现出高度一致性。此外,Gemini-2.5-Pro 的标注结果与人工评分也具有一致性。

社会情感角色

本研究基于 Bales 互动过程分析(IPA)框架,对推理轨迹中社会情感角色的呈现情况展开分析。该框架将话语划分为 12 种互动角色类型,每种类型均在提示词中通过具体行为描述进行操作性定义。以 Gemini-2.5-Pro 模型构建的 LLM-as-judge 评估器,会分别统计这 12 类角色的独立出现次数;在核心分析环节,作者将这些统计结果进一步归总为四大高阶类别,具体如下:

信息给予类角色:包括提出建议、表达观点、提供导向。信息征询类角色,包括征询建议、征询观点、征询导向。积极情感类角色,包括展现团结、释放紧张、表示认同。消极情感类角色,包括表现对抗、显露紧张、表示异议。

在核心分析采用的四大高阶 IPA 类别中,评分者间信度均达到较高水平。

为衡量推理轨迹中社会情感角色是否存在交互共现特征,作者针对两组角色组合计算 Jaccard 指数。该指数用于衡量模型是否会在同一条推理轨迹中协调互补性角色,而非孤立地使用单一角色。Jaccard 指数越高,代表模型的互动模式越均衡、趋近于对话形态;指数越低,则说明其推理过程更偏向单向、独白式的表达。

认知行为

本研究采用 Gemini-2.5-Pro 作为 LLM-as-judge 评估器,识别出四类此前已被证实对语言模型推理准确率存在影响的认知行为。

在测量环节,作者沿用了 Gandhi 等人使用的提示词与示例,该套材料的有效性已通过多名人工评分者验证。每类认知行为均在提示词中附带具体示例,以操作性定义的方式指导标注工作,具体如下:

结果核验:指推理链中明确将当前推导结果与目标答案进行比对的情形。提示词中给出的典型示例包括:「该推导过程得出结果 1,与目标值 22 不符」「由于计算结果 25 不等于目标值 22」。路径回溯:指模型意识到当前推理路径无法得到正确结果,进而明确返回并尝试其他方法的情形。子目标拆解:指模型将原问题分解为若干更小、可分步完成的中间目标的情形。逆向推理:指模型从目标答案出发,反向推导至初始问题的情形。

在这四类认知推理行为的标注上,Gemini-2.5-Pro 与 GPT-5.2 的一致性处于良好至极佳区间。Gemini-2.5-Pro 的标注结果与人工评分也呈现出高度一致性。

上述信度评估的计算基于两类推理轨迹样本:一类是用于解决通用推理问题的 30 条推理轨迹,另一类是 Qwen-2.5-3B 模型在强化学习过程中生成的 50 条推理轨迹。

特征干预

为探究会话行为在推理过程中发挥的作用,作者采用稀疏自编码器(SAE),对模型激活空间内具有可解释性的特征进行识别与操控。稀疏自编码器可将神经网络的激活值分解为一组稀疏的线性特征,从而能够在不修改模型权重的前提下,对特定行为维度实施定向干预。本研究使用的稀疏自编码器,基于 DeepSeek-R1-Llama-8B 模型第 15 层的残差流激活值训练得到。

从候选特征中,作者最终选定了特征 30939。经大语言模型评估器归纳,该特征的定义为「用于表达惊讶、顿悟或认同的话语标记」。在涉及话轮转换与社交互动的语境中,当出现「Oh!」这类 token 时,该特征会被激活。特征 30939 的会话占比为 65.7%(在所有特征中处于第 99 百分位),同时具备高度稀疏性(仅在 0.016% 的 token 上激活),这表明该特征是会话现象所特有的,而非适用于通用语言模式的特征。

在文本生成阶段,作者通过激活值添加法对特征 30939 进行调控:在每个 token 的生成步骤中,将该特征的解码器向量按调控强度系数 s 进行缩放后,叠加至模型第 15 层的残差流激活值中。

实验结果

先说主要结论,本文证明了,即便在推理轨迹长度相近的条件下,推理模型依然表现出更高频率的对话式行为和社会情绪角色。

对话行为和社会情感角色

DeepSeek-R1 的推理过程中明显出现了视角切换和观点冲突,并通过诸如「不同意」「给出观点」「提供解释」等社会情绪角色加以体现,例如:「但这里是环己 - 1,3 - 二烯,而不是苯。」「另一种可能是高温会导致酮失去 CO 之类的反应,但不太可能。」

相比之下,DeepSeek-V3 在同一问题上的推理轨迹中,既没有视角冲突,也没有视角切换,更不存在分歧表达,只是以单线独白的方式连续给出观点和解释,且缺乏自我修正,缺少不完整的推理。

在一个创造性句子改写任务中,DeepSeek-R1 同样通过视角冲突展开不同写作风格之间的讨论,并伴随「不同意」「提出建议」等社会情绪角色,例如:「但那样加入了‘根深蒂固’,原句里并没有,我们应该避免添加新想法。」「等等,那不是一个词。」「不过要注意,‘cast’ 的力度不如 ‘flung’,所以我们用 ‘hurled’ 更合适。」

而 DeepSeek-V3 几乎没有出现冲突或分歧,只是给出若干建议,缺乏 DeepSeek-R1 中那种反复比较、逐步修正的过程。



如图 1a 结果表明,DeepSeek-R1 和 QwQ-32B 的对话式行为出现频率显著高于各类指令微调模型。与 DeepSeek-V3 相比,DeepSeek-R1 在提问 — 回答(=0.345)、视角切换(=0.213)以及整合与调和(=0.191)方面均显著更频繁。QwQ-32B 相对于 Qwen-2.5-32B-IT 也呈现出高度一致的趋势,在提问 — 回答、视角切换、视角冲突和整合行为上均显著更多。值得注意的是,无论模型参数规模大小(8B、32B、70B 或 671B),所有指令微调模型的对话式行为出现频率都始终处于较低水平。

如图 1b 所示,与对应的指令微调模型相比,DeepSeek-R1 和 QwQ-32B 均展现出更具互惠性的社会情绪角色结构:它们既会提出问题、请求指引、意见和建议,也会给予回应,同时还表现出负向与正向的情绪角色。

指令微调模型主要以单向方式给出指引、观点和建议,几乎不进行反向提问,也缺乏情绪层面的互动,其推理过程更像是一段独白,而非对话的模拟。

来源:https://www.163.com/dy/article/KK73B5990511AQHO.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
OpenClaw自动化内容创作系统使用指南与优势解析

OpenClaw自动化内容创作系统使用指南与优势解析

当您搭建端到端自动化内容创作流程时,如果遇到OpenClaw框架无法正常生成内容、格式化文档或执行发布任务的情况,问题根源通常集中在几个核心环节。模型连接异常、关键技能模块失效、浏览器自动化环境故障或记忆索引损坏,都可能导致整个工作流中断。无需担忧,这类系统性问题大多可以通过结构化排查来解决。遵循以

时间:2026-05-18 21:09
豆包AI专属模型训练步骤详解

豆包AI专属模型训练步骤详解

训练豆包AI专属模型需遵循五个步骤。首先准备与业务相关的高质量数据,并进行清洗、标注与划分。随后在平台配置环境,选择基础模型并上传数据。接着启动微调训练,关注指标变化。完成后将模型部署为API服务,配置访问权限与限流。对于问答场景,可采用知识库增强的轻量训练方式,快速生效。

时间:2026-05-18 21:09
YC开源GBrain八层架构打造个人AI第二大脑解决记忆难题

YC开源GBrain八层架构打造个人AI第二大脑解决记忆难题

YC总裁开源GBrain项目,旨在解决大模型长期记忆缺失问题。该项目采用八层架构,不仅强化检索能力,更通过认识论层、实体知识图谱和梦境循环等设计,实现信息的溯源、关联与自主整合进化。相比传统RAG,GBrain在测试中展现出显著性能提升,被视为构建“AI第二大脑”的重要探索,有望提升个人生产力。

时间:2026-05-18 21:09
腾讯AI平台吐司上线 一键生成App原型预览

腾讯AI平台吐司上线 一键生成App原型预览

腾讯推出AI应用生成平台“吐司”,用户通过自然语言描述创意,AI即可自动生成应用原型并打包为APK文件。平台提供创作、分享、灵感交流与搜索四大功能,旨在降低门槛,鼓励用户实现灵感并进行二次创作,构建从创意到原型的闭环社区生态。

时间:2026-05-18 21:08
arXiv新规严禁AI代写论文 署名作者将连带受罚

arXiv新规严禁AI代写论文 署名作者将连带受罚

arXiv平台出台新规,严惩利用生成式AI制造低质量论文的行为。若发现论文中存在AI生成的未核查内容或虚假引用,所有署名作者将被封禁一年,解封后投稿需先通过期刊评审。新规强调签名即担责,旨在遏制学术不端。陶哲轩对此表示支持,认为加强学术消化环节至关重要。此举回应了AI生成论文泛滥。

时间:2026-05-18 21:08
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程