腾讯TiG框架:AI玩转王者荣耀,DeepSeek/Qwen练就战略思维

10月4日最新消息,腾讯AI实验室在其最新研究中创新性地选取了《王者荣耀》这款热门MOBA游戏作为实验平台,开发了名为TiG(Think in Games)的全新AI训练框架。这项突破性研究成果已在Hugging Face和arXiv两大权威学术平台正式发布。

研究团队在论文中指出,当前AI系统存在明显的认知断层问题:传统游戏AI虽然在操作执行层面表现出色,但缺乏真正的战略思考能力;而大语言模型虽能进行战术推演,却难以将思考转化为具体游戏行为。TiG框架的创新之处在于实现了AI思考与行动的同步闭环。

实验设计中,研究人员精选了《王者荣耀》中40个典型战术场景,包括上路压制、暴君争夺、高地防守等核心战术行为。为确保数据公正,样本中胜负场次保持均衡。AI不仅需要做出正确的战术选择,还必须给出符合游戏逻辑的战略分析。

训练过程采用创新性的双阶段模式:第一阶段通过监督学习让AI掌握基础决策模式;第二阶段引入激励机制进行强化学习,正确决策获得1分奖励,错误则不计分,以此巩固模型的战术判断能力。

研究团队对比测试了Qwen系列多个版本的语言模型(7B/14B/32B参数),并以DeepSeek-R1大模型作为基准参照。实验创新性地采用"群体相对策略优化"(GRPO)技术,通过DeepSeek-R1生成的高质量训练数据进行策略优化。

令人惊喜的是,经TiG框架训练的AI不仅能执行战术动作,还展现出类人的战术解说能力。例如,AI会分析指出:"对方下路防御脆弱,适合发起突袭,但要警惕敌方打野反蹲。"值得注意的是,这些AI在获得游戏智能提升的同时,原有的语言理解和逻辑推理能力完全保留。

最终测试数据验证了TiG框架的有效性:
对照组DeepSeek-R1:86.67%决策正确率
Qwen3-14B:90.91%的正确率表现最为突出
Qwen2.5-32B:准确率提升幅度达20.17个百分点
Qwen2.5-14B:准确率提升29.87个百分点的飞跃式进步
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
开源AI Agent网络协作:OpenAgents引发业内热议
一款名为OpenAgents的开源项目近期引发技术圈热议。该项目致力于构建开放协作的智能体网络,被部分开发者誉为 "年度最具潜力的Agent生态框架 ",同时也面临 "技术泡沫 "的质疑。其核心目标是通过网
2026款奔驰E级:混动省油AMG强劲,L2智能驾驶豪华首选
当豪华中大型车市场的竞争进入白热化阶段,2026款奔驰E级以“全能选手”的姿态闯入视野。这款车不再让消费者在性能、能耗与智能之间做艰难抉择,而是将三大核心诉求融为一体,试图重新定义“豪华车标杆”的衡
"电力工程号A星"长春发射,实现电力监测立体智能化
近日,一则来自吉林长春的航天消息引发关注——由长光卫星技术股份有限公司与国网电力工程研究院有限公司联合研制的“电力工程号A星”(“吉星”高分07A01星)正式从吉林省航天信息产业园启程,即将奔赴酒泉
华为2025全球合作伙伴大会:共筑AI智慧生活新未来
10月10日至12日,2025中国移动全球合作伙伴大会在广州琶洲保利世贸展馆举行。本届大会以“碳硅共生合创AI+时代”为主题,汇聚了来自通信、终端、汽车、AI、能源等多个领域的数百家合作伙伴。作为中
小米旧机升级高功率PPS充电,澎湃芯片加持性能跃升
小米近日在充电技术领域再传新动态,其最新推出的17系列手机实现全面兼容100W PPS通用充电协议。这项突破意味着无论使用小米原装充电器还是第三方品牌设备,用户均可享受快速充电体验。与此同时,小米宣
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















