数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

谷歌与OpenAI让AI玩《精灵宝可梦》，实测GPT和Gemini谁更强

谷歌与OpenAI让AI玩《精灵宝可梦》，实测GPT和Gemini谁更强

热心网友时间：2026-01-25

转载

1月25日消息，要想准确评估AI的智能程度与能力，眼下涌现了各种各样的跑分测试和评测方法。不过，一种相对小众的测试方式，最近也在AI领域引发了不少关注。

谷歌、OpenAI争相让旗下AI玩经典《精灵宝可梦》游戏，衡量GPT、Gemini的真正实力

目前，谷歌、OpenAI和Anthropic等AI巨头，正让自家的大语言模型挑战《精灵宝可梦》经典系列游戏，并以此作为衡量其AI性能表现的新标尺。

Anthropic公司AI部门负责人戴维·赫什对此给出了他的解读：“比起《Pong》这类规则简单的游戏，《精灵宝可梦》之所以更能吸引机器学习社区的关注，是因为它的复杂性和开放性更强。这款游戏对计算机程序而言，充满了各种意想不到的挑战。”

实际上，赫什从去年开始就在Twitch平台上进行直播。他的日常就是用公司自家的Claude模型来玩《精灵宝可梦》。这位负责人平时的工作就是帮助客户部署AI解决方案，因此，他开启直播本质上也是一场公开的模型能力测试。

这位负责人的创新做法，也激发了不少开发者的灵感。他们陆续推出了“Gemini玩《宝可梦》”、“GPT玩《宝可梦》”等类似的直播节目。

后来，这些直播甚至引起了谷歌和OpenAI官方的注意。开发团队有时还会客串直播间，亲自调整模型参数。在最新的模型能力加持下，Gemini和GPT已经成功通关了Game Boy时代的《宝可梦蓝》，目前正在挑战续作；而Claude至今还没能打通任何一个版本。

谷歌、OpenAI争相让旗下AI玩经典《精灵宝可梦》游戏，衡量GPT、Gemini的真正实力

那为什么要用《宝可梦》来评估AI性能呢？赫什解释道：“因为这款游戏能为我们提供一种直观观测模型表现的方法，同时还能够用量化指标来评估其综合能力。”

通常来说，玩家在《宝可梦》系列游戏中，需要不断升级、训练已有的或是刚刚抓到的宝可梦，还要击败道馆馆主来捕捉新的宝可梦。整个游戏流程并非简单的线性推进，而是充满了复杂的判断与取舍。

此外，玩家在游戏中还经常要面对各种抉择：是先冒险挑战强大的训练家来获取稀有宝可梦，还是稳扎稳打，打造出一支实力均衡的队伍。

显然，人类非常擅长做这类决策，这也是游戏的乐趣所在。但对于AI来说，这无疑是一场关于逻辑推理、风险评估以及长期规划能力的综合考验。

因此，研究人员会深入剖析AI在游戏中的决策方式，以更深刻地理解模型能力的边界所在。

赫什还会将AI玩《宝可梦》的过程与结果分享给客户，以帮助改进控制框架，从而提升其算力的使用效率，让模型能够更加高效地运转。

来源:https://tech.ifeng.com/c/8qCjYOVqRNl

上一篇：蔚来换电网络超7309座，电池升级进展突破90%

下一篇：进OpenAI不必读博？核心成员揭秘o1模型关键

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

Romark Logistics与Dexory合作以AI实时库存可视化平台优化仓储管理

Romark Logistics与Dexory合作以AI实时库存可视化平台优化仓储管理

在现代化仓储物流管理中，实现实时、精准的库存可视化是提升运营韧性与效率的核心环节。近日，知名定制化第三方物流服务商Romark Logistics宣布了一项重要技术升级：在其位于哈兹尔顿的仓储基地正式部署由Dexory提供的AI驱动仓储可视化平台DexoryView。此举标志着Romark Logi

时间：2026-05-20 22:59

谷歌Gemini Spark AI助手全天候处理数字任务提升效率

谷歌Gemini Spark AI助手全天候处理数字任务提升效率

今天，谷歌正式将我们带入了一个新的阶段：AI智能体时代。其推出的Gemini Spark，被定义为一款能够全天候运行的个人AI助手。它的核心使命很明确——接管我们日益复杂的数字生活，并实实在在地替我们处理一些工作。这款助手的“大脑”是最新发布的Gemini 3 5 Flash模型，而协调其行动的“

时间：2026-05-20 22:59

两款AI科学助手成功实现药物重定向应用

两款AI科学助手成功实现药物重定向应用

近日，《自然》杂志同期发表了两项突破性研究，展示了两种旨在革新科研工作流的AI系统。一款来自谷歌，名为Co-Scientist，强调人机深度协作；另一款由非营利机构FutureHouse开发，其系统更进一步，能对特定生物实验数据进行自动化评估与分析。尽管谷歌表示其系统架构同样适用于物理学探索，但两

时间：2026-05-20 22:59

谷歌AI Studio上线对话式开发安卓原生应用教程

谷歌AI Studio上线对话式开发安卓原生应用教程

谷歌近期对其“氛围编程”平台进行了重要升级。现在，开发者可以直接在谷歌AI Studio中，通过自然语言对话来构建安卓原生应用。具体操作流程非常直观：用户只需用日常语言描述自己的应用构思，平台内置的安卓模拟器便会实时生成应用预览。若想在实际设备上测试，只需将安卓手机连接至电脑，即可直接安装体验。更

时间：2026-05-20 22:59

1099元龙虾耳机开箱评测音质与性价比如何

1099元龙虾耳机开箱评测音质与性价比如何

今天，科大讯飞旗下孵化的AI硬件品牌未来智能，正式发布了其创新产品——viaim讯飞智能体耳机。这款产品的核心突破在于，将先进的办公AI Agent能力，集成到一款日常可佩戴的耳机设备中。它不仅超越了传统录音转写功能，更实现了长期记忆存储、多模型灵活调用与智能复盘分析，目标清晰：将耳机从单纯的音频播

时间：2026-05-20 22:58

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

漫蛙漫画防走失网页链接

2026年烈焰觉醒真实礼包码免费领取永久兑换

星之破晓4GB运行内存能流畅玩吗游戏配置要求详解

Wizardry Variants Daphne官网地址与游戏攻略指南

0.1折手游超越黎明清凉版官方正版下载

星之破晓集卡活动参与方法与玩法全攻略

小小仙王清凉版官方下载免费获取正版安装包

星之破晓星魂战场位置与玩法全攻略

幻界之境最新兑换码大全免费领取全部礼包码

乱涂彩世界游戏需要多大内存空间

漫蛙漫画防走失网页链接

盗宝小妖高分通关攻略与实战技巧详解

魔兽世界凄凉之地前往路线与交通指南

无限火力剑魔最强出装符文搭配攻略

和平精英最新版更新教程卡顿下载慢解决方法汇总

DNF皇女艾莉婕身份背景与剧情详解

梦幻西游东海湾蜃境入口选择攻略与路线推荐

魔兽世界巫妖王怀旧服裁缝专业速冲450级指南

DNF女枪手职业推荐：哪个职业最强最好用

三角洲行动M82狙击枪改装方案配件搭配与实战技巧

漫蛙漫画防走失网页链接

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

边境检察官steam售价与中文名全解析

边境检察官steam售价与中文名全解析发布于 2026-05-20

第五人格5月21日更新维护公告内容详解

第五人格5月21日更新维护公告内容详解发布于 2026-05-20

偃武XP赛季活动福利全解析与领取指南

偃武XP赛季活动福利全解析与领取指南发布于 2026-05-20

狂发疯杰克游戏值得玩吗玩法特色与上手攻略详解

狂发疯杰克游戏值得玩吗玩法特色与上手攻略详解发布于 2026-05-20

铁锈战争新手入门指南与实战玩法攻略

铁锈战争新手入门指南与实战玩法攻略发布于 2026-05-20

螺旋圆舞曲2全角色攻略指南解锁所有可攻略人物方法

螺旋圆舞曲2全角色攻略指南解锁所有可攻略人物方法发布于 2026-05-20

我本千金伙伴培养全攻略从入门到精通指南

我本千金伙伴培养全攻略从入门到精通指南发布于 2026-05-20

台球风云游戏玩法介绍与上手体验评测

台球风云游戏玩法介绍与上手体验评测发布于 2026-05-20

三国志战略版PVP盾兵阵容搭配攻略

三国志战略版PVP盾兵阵容搭配攻略发布于 2026-05-20

2026年热门二战游戏推荐人气战争题材游戏下载合集

2026年热门二战游戏推荐人气战争题材游戏下载合集发布于 2026-05-20

2026年热门手游实名认证指南与必玩游戏推荐

2026年热门手游实名认证指南与必玩游戏推荐发布于 2026-05-20

洛克王国手游PVP最强阵容搭配攻略

洛克王国手游PVP最强阵容搭配攻略发布于 2026-05-20

排兵布阵游戏预约开启参与活动赢取黄金奖励

排兵布阵游戏预约开启参与活动赢取黄金奖励发布于 2026-05-20

霍格沃茨之遗阿瓦达索命咒学习方法与获取全攻略

霍格沃茨之遗阿瓦达索命咒学习方法与获取全攻略发布于 2026-05-20

异星之地星空三十一区5月25日开服

异星之地星空三十一区5月25日开服发布于 2026-05-20

2026年热门小羊羊游戏推荐合集与玩法分享

2026年热门小羊羊游戏推荐合集与玩法分享发布于 2026-05-20

Windows批量修改文件后缀名教程使用CMD命令一键快速完成

Windows批量修改文件后缀名教程使用CMD命令一键快速完成发布于 2026-05-20

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力

Win11 查看 CPU 硬件级安全隔离支持方法提升系统防御力发布于 2026-05-20

如何查询Mac型号年份与配置信息

如何查询Mac型号年份与配置信息发布于 2026-05-20

Linux系统Nginx服务器HTTPS证书安装配置教程

Linux系统Nginx服务器HTTPS证书安装配置教程发布于 2026-05-20

Mac放大镜功能开启指南轻松看清屏幕细节

Mac放大镜功能开启指南轻松看清屏幕细节发布于 2026-05-20

Mac终端清理DNS缓存详细步骤与操作指南

Mac终端清理DNS缓存详细步骤与操作指南发布于 2026-05-20

Win11任务栏合并标签如何关闭恢复经典文字导航栏

Win11任务栏合并标签如何关闭恢复经典文字导航栏发布于 2026-05-20

Mac桌面图标自动整理技巧：堆栈功能高效管理文件

Mac桌面图标自动整理技巧：堆栈功能高效管理文件发布于 2026-05-20

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集