DeepMind终结十年争论：GPT-5倚仗世界模型实现关键推理

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

DeepMind终结十年争论：GPT-5倚仗世界模型实现关键推理

热心网友时间：2025-10-31

转载

【导读】GPT-5令人惊艳之处，不只是文笔流畅，更在于它展现出强大的推理能力。近期一项研究揭开了背后的秘密：通用智能体之所以聪明，并非因为参数更多，而是它们在“大脑”中悄然构建起一张“世界模型”。这幅无形的认知地图，也正在重塑我们对AI的理解。

GPT-5正式推出后，最让人震撼的并非其吟诗作画的本领，而是它在逻辑推理上的惊人表现。

网友感叹：“感觉像是在和博士讨论问题”，更有媒体直言它的逻辑水平已经“堪比专家”。

为什么会出现这种“思维飞跃”的效果？

最新发布的研究论文给出了答案：

通用智能体能进行推理，不靠死记硬背，而是因为它们在神经网络中悄然生成了对现实世界的抽象表征。

论文传送门：https://arxiv.org/pdf/2506.01622

是模仿还是思考？学界争论了十年之久

究竟什么是“世界模型”？简单来说，它就是AI对现实规律的预测图谱。

对人类而言，我们天生具备预测的能力：

球在桌边滚动→它可能会掉下去

开车时看到红灯→如果不刹车可能引发事故

两个人对话，其中一人说“我饿了”→下一步很可能要寻找食物

那么对于AI来说，它是如何形成这种能力的呢？

在过去的十几年里，学界一直在争论——AI到底仅靠模仿（无模型学习），能否真正解决复杂问题？

“模仿派”认为，只要有足够多的数据加上强大的算力，AI就能像条件反射一样给出正确答案。

在GPT-3.5时代，大部分AI的回答都像在“背诵题库”，有时蒙对，有时则完全错误。

与此相对的则是“思考派”。他们坚持认为，如果没有形成对现实的理解框架，AI永远只是机械的复读机。

一旦问题需要多步逻辑推理，比如解数学题、规划一个流程，纯模仿型AI就会掉链子。

最近，一项研究为这些争论按下了终止键：

任何一个智能体只要能完成多步骤的复杂目标任务，它的策略中就必然隐含了对环境的认知模型。

在学术框架中，“目标、策略、世界模型”曾经像缺了一角的三角形。

已知世界模型和目标，可以推导出最优策略；已知策略和世界模型，可以反推出目标。

图1 目标g、策略π、世界模型p之间的三角关系

而现在最后一角也被补齐——只要知道智能体的策略和目标，就能恢复出它对环境的理解模型。

这个推导让“世界模型不可或缺”的结论更加稳固。

也就是说，GPT-5之所以能展现惊人的推理能力，是因为它在训练过程中，逐步形成了对现实规律的内在表征。

可以说，没有世界模型，就没有真正的通用智能。

探究AI大脑里的认知地图

仅有理论还不够，研究团队决定深入验证。

既然说智能体一定会“形成”世界模型，那么我们能否在实验室里，把这张隐形的“认知地图”提取出来？

为AI搭建的“迷你世界”

为了验证AI体内是否真的存在世界模型，研究团队设计了一个巧妙的实验。

他们搭建了一个虚拟世界，里面只有几个状态（X、Y），它们会按一定概率互相跳转。

然后研究人员将任务交给智能体，让它自主探索这个世界。

最后，研究人员尝试仅根据智能体的行为表现，反推出它对状态转换规律的认知。

图2 智能体-环境系统示意图

任务越复杂，误差反而越小

刚开始，智能体在简单目标里横冲直撞，恢复出来的世界模型差错很多，还有一堆错误。

可当任务变得复杂（比如要先到X，再转到Y），情况就完全不同：它会自动构建更精细的“状态转移概率表”。

随着任务难度增加，世界模型的误差迅速下降。

图3 任务复杂度vs世界模型误差曲线

无论是训练样本还是任务深度，结果都指向同一个结论——任务越复杂，世界模型越精确。

实验员还尝试了更复杂的目标组合：智能体需要在不同状态之间来回跳转，才能完成目标。

图4 复合目标实验示意图

没有认知地图，就没有真正智能

数学推理也印证了这一点。

实验表明，只要一个智能体在复杂任务中不会频繁犯低级错误，始终保持有限的“后悔值”，它的策略中就必然已经包含了环境的转移规律。

也就是说——世界模型不是AI的附加功能，而是它进化的必需品。

智能体越强大，内心构建的“认知地图”就越精确。

这就是为什么GPT-5会让人觉得“突然会推理了”，其实是它脑内的世界模型日渐清晰的体现。

一幅认知地图带来的希望与隐忧

实验告诉我们：只要AI能完成复杂任务，它的大脑里就一定存在某种“世界模型”。

这也解释了近来备受关注的“涌现能力”现象。

研究表示，这并非魔法，而是AI在完成任务过程中，认知模型逐步清晰的必然结果。

我们以为GPT-5突然学会了推理，其实是它在任务进程中，内部的世界模型逐渐明晰，于是能力自然显现。

这让人类看到了希望：如果世界模型真的存在，我们或许有机会把它抽取出来，借此理解AI的内心世界。

未来，当它变得更强大时，这或许能成为破解黑箱、提升安全性的关键。

但这也埋下了隐忧的种子。

真实世界远比实验室复杂，AI学到的地图或许是模糊的，甚至与人类理解不一致。

可能它觉得安全，而我们觉得危险。

对研究者来说，这同样是一个转机。

既然世界模型必然存在，那么我们或许能在未来把它抽取出来，用以解释和验证AI的决策依据。

这意味着，破解“黑箱”不再只是愿景，而有了真正的理论支撑。

所以，GPT-5带来的震撼不只是“它会推理”，更深层的意义在于：AI已经能在大脑中构建自己的认知地图。

而这幅地图，既可能是通往智慧之路的通行证，也可能成为未来不确定性的源头。

参考资料：

https://arxiv.org/abs/2506.01622

来源:https://36kr.com/p/3532732831603585

上一篇：安克避坑指南：3招解决设备连接难题

下一篇：自如14年变革2次，重塑租赁行业的底层逻辑

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

罗德施瓦茨联合研究机构 NVIDIA推出Isaac Nova Orin

Nexperia发布增强型电热模型罗姆开发新一代8英寸SiC MOSFET

研华DeviceOn/BI工业审核通过罗姆SiC MOSFET性能优势

Jupiter发币倒计时深度解析其产品与商业模式

NVIDIA推DRIVE Map多模式地图平台罗德与施瓦茨宣布卫星工业日计划

人工智能专业并非蹭热点 AI治理风险需警惕

阿里Qwen2.5-Omni-7B发布，听看读写性能强劲

NVIDIA医疗设备AI计算平台与瑞芯微芯片解决方案发布

阿里云万卡集群组网实战：算力网络解析

NVIDIA发布DGX H100系统罗德与施瓦茨推O-RAN无线电单元方案

ATK GEAR全面拥抱星闪生态加速无线互联升级

苹果发布M5 Pro与M5 Max 18核融合架构芯片

苹果M4处理器新款iPad Air发布无线连接增强

苹果iPhone 17e发布 4499元起 3月11日开售

币安Web3计算收益指南：如何参与DeFi新纪元并获取高回报

MWC荣耀双旗舰搭载骁龙8至尊版助力智能手机技术演进

开学季装备攻略希未AI全家桶搞定校园全场景需求

联想moto首款大折叠手机于MWC正式发布

三星Galaxy S26 Ultra上手 AI防窥屏隐私防护实用

内嵌天禧AI，ThinkPad与ThinkBook AI PC开工季上新

罗德施瓦茨联合研究机构 NVIDIA推出Isaac Nova Orin

Nexperia发布增强型电热模型罗姆开发新一代8英寸SiC MOSFET

研华DeviceOn/BI工业审核通过罗姆SiC MOSFET性能优势

Jupiter发币倒计时深度解析其产品与商业模式

NVIDIA推DRIVE Map多模式地图平台罗德与施瓦茨宣布卫星工业日计划

人工智能专业并非蹭热点 AI治理风险需警惕

阿里Qwen2.5-Omni-7B发布，听看读写性能强劲

NVIDIA医疗设备AI计算平台与瑞芯微芯片解决方案发布

阿里云万卡集群组网实战：算力网络解析

NVIDIA发布DGX H100系统罗德与施瓦茨推O-RAN无线电单元方案

相关攻略

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

2026-07-05 13:32

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

2026-07-05 13:31

云南以旧换新补贴扩围新增智能影音与无人机

2026-07-05 13:31

小米Redmi 7英寸高性能手机传闻即将发布

2026-07-05 13:30

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

2026-07-05 13:30

Caviar抢先发布定制版iPhone Ultra折叠屏售价13840美元起

2026-07-05 13:30

佳能EOS R8 Mark II全画幅无反9月发布复古设计成亮点

2026-07-05 13:30

System76 Adder Pro 15.3笔记本顶配酷睿Ultra 7与RTX 5070

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

幸福的二人房隐藏彩蛋大全发布于 2026-07-05

梦幻西游109化生寺平民属性合格标准发布于 2026-07-05

交错战线幽兰培养建议及阵容搭配攻略发布于 2026-07-05

梦幻西游仓库全部整理所需体力详解发布于 2026-07-05

选技大乱斗新手进阶上分攻略最强玩法指南发布于 2026-07-05

魔兽世界9.2大秘境装等掉落指南发布于 2026-07-05

动物城咖啡店下载渠道与官方下载地址大全发布于 2026-07-05

Valve正开发新物理引擎Ragnarok曝光发布于 2026-07-05

Win11频繁断网提示默认网关不可用怎么办发布于 2026-07-03

Mac如何取消正在进行的系统备份任务发布于 2026-07-03

电脑显示器刷新率锁死60Hz无法调整的解决方法发布于 2026-07-03

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程发布于 2026-07-03

博世洗衣机连接WiFi后手机无反应怎么办发布于 2026-07-05

九号电动车定位消失，重启能解决吗发布于 2026-07-05

东芝电饭煲复位键在面板哪个位置发布于 2026-07-05

家用扫地机器人推荐榜首吸力多大合适发布于 2026-07-05

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

DeepMind终结十年争论：GPT-5倚仗世界模型实现关键推理

是模仿还是思考？学界争论了十年之久

探究AI大脑里的认知地图

为AI搭建的“迷你世界”

任务越复杂，误差反而越小

没有认知地图，就没有真正智能

一幅认知地图带来的希望与隐忧

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池

云南以旧换新补贴扩围 新增智能影音与无人机

小米Redmi 7英寸高性能手机传闻即将发布

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

云南以旧换新补贴扩围新增智能影音与无人机