谷歌研究:DeepSeek推理模型如何通过“脑内群聊”优化AI智能
最近,谷歌的一项研究表明,像DeepSeek-R1这样的顶尖推理模型在解决复杂问题时,其内部会自发“分裂”出性格迥异的虚拟人格,比如外向型、严谨型或多疑型。这些不同的人格在模型思考过程中会展开激烈的社交与辩论,类似于人类“左右脑互搏”,从而使模型越“吵”越聪明。研究进一步揭示,当面对高难度任务时,这种内部冲突会更加明显且有益,而在处理简单任务时则会显著减少。
研究团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满对话感,内部裂变出的虚拟角色性格各异,能覆盖更多解题视角。例如,创意型角色负责提出新颖思路,批判型角色专司挑错补漏,而执行型角色则负责将方案落地验证。值得注意的是,这种多角色互动并非开发人员刻意设计,而是模型在追求推理准确性的过程中自发形成的机制。
借助稀疏自编码器(SAE),研究人员成功“监听”到了AI的“脑内群聊”。通过提取模型隐藏层神经元的激活数值,并利用SAE的稀疏约束机制,将复杂的信号拆解为独立的对话语义特征,从而识别出不同的内部逻辑实体,并为其打上虚拟角色标签,最终解码了AI内部多角色对话的行为模式。
实验数据表明,推理模型出现对话式行为的频率显著高于普通的指令模型。一个有趣的发现是,当强化模型的对话特征,例如放大“哦!”这类表达惊讶或转折的语气标记时,模型在算术推理任务中的准确率会得到显著提升。此外,在强化学习训练中,模型会自发学会使用对话式思考,并且那些预先经过多智能体对话数据微调的模型,在推理训练中的进步速度远超直接训练或使用独白式推理数据微调的模型。
这一发现呼应了人类演化生物学中的“社会脑假说”,即大脑的进化是为了应对复杂的社交关系和群体互动需求。如今,AI似乎也在通过与不同“人格”的社交互动来提升其智能水平。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
中芯国际封装技术最新布局与战略部署解析
5月15日,中芯国际在业绩说明会上披露了一项关键战略布局:公司自2015年起便已前瞻性地投入封装技术研发,尤其在先进封装领域进行了长期积累。经过数年的快速发展,其战略路径已非常明确——专注于为自身晶圆制造客户提供所需的关键前端封装技术支持。基于这一战略,中芯国际在过去十年间持续深耕3D CIS(CM
阿里巴巴推出AI工业知识考试系统确保回答准确性
最近,工业AI领域有一项研究值得关注。这项由阿里巴巴集团淘宝天猫多模态与工业AI团队主导的工作,已于2026年5月正式发布,论文编号为arXiv:2605 10267v2。其核心成果,是一套名为IndustryBench的专业测试系统。 不妨设想这样一个场景:你是一家工厂的采购经理,正考虑用AI来核
腾讯北大联合研发强化学习新方法提升机器人全局决策能力
强化学习是一种让智能体通过与环境交互、从试错中学习最优决策策略的人工智能技术。其核心机制类似于训练宠物:做出正确行为给予奖励,错误行为则没有。智能体在模拟或真实环境中不断尝试,根据反馈调整策略,最终找到获得最高累积回报的行动序列。然而,传统强化学习的样本效率低下是公认的难题——智能体往往需要数百万甚
香港中文大学研发频谱守护者优化器提升AI训练稳定性
训练大型语言模型,如同在云端构建一座持续生长的知识大厦。随着模型层数不断增加,任何微小的参数偏差都可能被逐层放大,最终导致训练过程失控。如何确保这座大厦在建造过程中始终保持结构稳定,一直是困扰研究人员的核心挑战。 近期,一项由香港中文大学、马克斯·普朗克智能系统研究所和西湖大学联合发布的技术报告,带
豆包服务中断原因与恢复时间详解
5月19日晚间,“豆包崩了”这一话题迅速冲上各大社交平台热搜榜首,引发广泛关注。众多用户反映,豆包AI服务突然出现中断,导致正在进行的在线学习、文案创作、代码编程等工作被迫暂停,一时间用户反馈激增。 事实上,这并非豆包首次出现服务异常问题。回顾今年1月28日,豆包就曾发生过一次影响范围较大的区域性服
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

