当前位置: 首页
AI资讯
谷歌新研究:DeepSeek推理现多重人格,左右脑互搏越用越聪明

谷歌新研究:DeepSeek推理现多重人格,左右脑互搏越用越聪明

热心网友 时间:2026-01-20
转载

AI变聪明的真相,竟然是在“颅内群聊”?

谷歌的最新研究表明,像DeepSeek-R1这样的顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……

大模型的解题推理过程,就是这些人格之间一场精彩的社交辩论会;左右脑互搏的场面大概是:

“这个思路对吗?试试这样验证……”

“不对,之前的假设忽略了XX条件。”

……

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

有意思的是,AI还越吵越聪明。

研究发现,当遇到GPQA研究生级别科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突破会变得更加激烈。

相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的内部分歧对话则会明显减少。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

模型推理过程正是“左右脑互搏”

团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。

创意型角色擅长提出新颖思路,批判型角色专注于挑错补漏,执行型角色负责落地验证……

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

通过这些不同人格的头脑风暴,不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说,自己在思考的时候,也会出现“左右脑互搏”的现象。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢?

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

团队借助稀疏自编码器SAE,对AI的推理黑盒进行了深度解码,成功“监听”到了AI的颅内群聊。

首先,研究者让AI执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿参数构成的复杂非线性信号,无法直接对应任何语义。

将这些激活数据输入SAE,通过SAE的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;

通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了AI内部的多角色对话行为。

“哦?”能让推理更准确

通过对比DeepSeek-R1与DeepSeek-V3、Qwen-2.5-32B-IT这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

这里还有个很有意思的发现——

“哦?”能让推理更准确。

当团队通过激活添加法强化模型的对话特征,放大“哦?”这类表达惊讶、转折的话语标记时,模型在CountDown算术推理任务中的准确率直接从27.1%翻倍至54.8%。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;

而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在Qwen-2.5-3B和Llama-3.2-3B两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出10%以上,Llama-3.2-3B到训练后期差距甚至扩大到22%。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

这一发现恰好呼应了人类演化生物学中的著名理论“社会脑假说”。

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来,AI也是一样,为了变聪明,得先学会和不同“人格”社交!

来源:https://tech.ifeng.com/c/8q4ARvfiv2w

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
特朗普暂停AI行政令背后监管与竞争的博弈

特朗普暂停AI行政令背后监管与竞争的博弈

美国一项针对前沿AI模型的自愿安全测试行政令在签署前数小时被叫停。总统特朗普因担心监管阻碍技术领先地位而拒绝批准,凸显出美国在管控AI风险与维持竞争优势之间的政策矛盾。这一温和的自愿评估框架,仍在安全治理与竞争焦虑的拉扯中被暂时搁置。

时间:2026-05-23 12:40
OpenAI 2026年第一季度营收达57亿美元 领先Anthropic

OpenAI 2026年第一季度营收达57亿美元 领先Anthropic

OpenAI在2026年第一季度营收达57亿美元,较竞争对手Anthropic同期高出约10亿美元。其收入主要来自ChatGPT消费级产品,付费用户持续增长,但业务重心正转向企业服务。尽管营收亮眼,公司调整后营业利润率仍为负值,面临显著亏损。为应对竞争与盈利压力,OpenAI正加速推进上市进程,最早或于今年9月进行IPO。

时间:2026-05-23 12:40
马斯克AI助手Grok在美国政府遇冷使用率极低

马斯克AI助手Grok在美国政府遇冷使用率极低

马斯克旗下xAI的聊天机器人Grok在美国联邦政府市场遇冷。数据显示,在400多个政府AI应用案例中,Grok仅占三例,远落后于OpenAI等竞争对手。其低价策略未能推动普及,使用多限于基础任务。专家指出,这可能因模型难以满足政府安全需求,对SpaceX依赖AI业务的高估值构成挑战。

时间:2026-05-23 12:40
马斯克SpaceX星舰V3成功发射 NASA局长盛赞史上最强火箭

马斯克SpaceX星舰V3成功发射 NASA局长盛赞史上最强火箭

北京时间5月23日,SpaceX星舰V3火箭成功首飞并溅落印度洋。该火箭为史上最大最强,配备33台全新猛禽3发动机,运力超100吨,并集成在轨燃料加注系统。它已被选为NASA重返月球计划的载人着陆器,其成功标志着人类深空探索能力迈出重要一步。

时间:2026-05-23 12:37
合肥再添区域总部项目正式签约落地

合肥再添区域总部项目正式签约落地

近日,太初星火区域总部项目签约落地合肥瑶海区。该公司专注“AI+3D打印”医疗应用,提供从术前规划到术后康复的全链条智能解决方案。项目已快速完成注册,计划投资1 1亿元建设研发中心与生产基地,预计五年内产值可达2 85亿元,将有力助推当地生物医药与人工智能产业集群发展。

时间:2026-05-23 12:36
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程