当前位置: 首页
AI教程
谷歌乒乓机器人学1.4万对拉球击败多数选手,网友预测4年后战奥运

谷歌乒乓机器人学1.4万对拉球击败多数选手,网友预测4年后战奥运

热心网友 时间:2026-07-03
转载

先给个核心判断:一个学习了1.4万次对拉球的AI乒乓球机器人,能够在乒乓球桌上与人类业余选手打得有来有回——这一成果本身,就足以令人振奋。

乒乓球的影响力早已无需多言,每一代国人心中都有属于自己的国乒记忆。这个夏天,2024巴黎奥运会上,人们再次见证了众多国乒名场面。最新战报显示,中国乒乓男团与女团均已成功晋级巴黎奥运会决赛,战况正酣。而就在8月9日,DeepMind研究团队公布了一项新突破:首款能够与人类业余水平抗衡的AI乒乓球机器人正式亮相。该系统将ABB IRB 1100工业机械手臂与DeepMind定制的AI软件深度融合。虽然与专业运动员相比仍存在明显差距,但它在应对复杂物理任务时展现出的瞬时决策力与自适应能力,确实令人眼前一亮。

“Alpha 乒乓”来了,学了 1.4 万个对拉球,谷歌乒乓机器人球技横扫大部分选手,网友:4 年后代表美国打奥运

事实上,利用乒乓球来测试机器人手臂,已有十多年的历史。为什么偏偏是乒乓球?因为这项运动对速度、反应和策略的要求极为严苛——而这恰恰是机器人的短板所在。DeepMind团队在arXiv上发表的预印本论文中指出:“这是第一款能够达到人类水平运动能力的机器人智能体,代表着机器人学习与控制领域的又一里程碑。”
预印本论文链接:https://arxiv.org/abs/2408.03906

据了解,这款尚未正式命名的乒乓球机器人智能体(不妨称之为“AlphaPong”),由David B. D’Ambrosio、Saminda Abeyruwan和Laura Graesser等研究人员共同开发。在与不同技能等级的人类选手进行的多场对抗中,它的表现相当扎实。一项涉及29名参与者的研究显示,这款AI机器人取得了45%的总胜率,展现出了业余级别的实战球技。

更值得关注的是,它对初学者保持了100%的胜率,对中级选手胜率达到55%。然而一旦面对高级选手,它便无一例外地落败。换句话说,它目前还不足以与高手正面交锋。谷歌DeepMind发布的视频展示了AI智能体与人类乒乓球运动员对战的画面,现场氛围颇为有趣。

有网友调侃道:“四年后,她应该代表美国参加奥运会。”也有人不服气地表示:“作为一名拥有30多年乒乓球经验的终身运动员,我怀疑目前这款机器人能不能从我手里拿下一分。”

能与各级选手对打,自适应输出乒乓球战术

乒乓球是一项对体能要求极高的运动,人类运动员需要经过多年刻苦训练才能达到高水平。那么,这个机器人又是如何炼成的?

AlphaPong的物理配置包括一台6自由度机械臂ABB IRB 1100,安装在两条线性轨道上,这意味着它可以在2D平面上自由移动。高速摄像机负责追踪球的飞行位置,而动作捕捉系统则实时观察人类对手的球拍动作。简而言之,硬件方面采用了标准的工业级配置,真正的灵魂在于软件算法。

为了构建驱动机械臂的“大脑”,DeepMind开发了一套两级架构:底层是技能控制器,负责执行特定的乒乓球技术动作,如正手击球、反手回球、接发抢攻等;上层是战略决策器,这是一套更为复杂的AI系统,能够分析比赛局势、适应对手打法风格,并针对每一个来球选择激活对应的技能。换言之,它具备足够的适应性,可以与任何业余选手交手,而无需针对每个人重新训练。

研究人员透露,AlphaPong的关键创新之一在于训练方法。他们采用了一种混合策略:在模拟物理环境中运用强化学习,同时将真实世界的实例作为训练数据来源。这种技术让机器人从大约1.75万种真实存在的乒乓球飞行轨迹中学习——对于一项复杂任务而言,这个数据集其实相当精简。谷歌DeepMind通过视频展示了它如何与高水平人类球员对战,场面相当精彩。

更巧妙的是,他们采用了一个迭代过程来持续完善机器人的技能。从小批量的人机对战数据起步,然后让AI与真实对手进行实战。每场比赛都会生成关于球飞行轨迹与人类策略的新数据,团队将这些数据反馈到模拟环境中进行进一步训练。整个过程重复了七个周期,使得机器人能够不断适应更熟练的对手和更多样的打法。到最后一轮,AI已经从数万个对拉球和数千次发球中充分学习,积累了丰富的乒乓球知识,成功弥合了模拟与真实场景之间的差距。

有趣的是,英伟达也一直在探索类似的模拟物理系统。例如Eureka,这套系统允许AI模型在模拟空间里快速学习控制机械臂,而非在现实中缓慢摸索。通过在模拟中加速物理效应,甚至能够同时进行数千次试验,这种方法有望大幅减少未来机器人训练中复杂交互所需的时间和资源。

被人类选手所喜爱,但因局限性不敌高水平球员

除了对战技术上的突破,这项研究还深入探讨了人类与AI选手之间的对抗体验。结果有些出人意料:即便输了,人类选手也表示非常享受这样的比赛过程。研究人员指出:“在所有技能组和胜率情况下,人类选手均表示与机器人对战既‘有趣又引人入胜’。”如此积极的反响,暗示着AI在体育训练和娱乐领域拥有相当广阔的应用前景。

当然,这套系统也有自身的短板。它在处理极速球和高球方面表现不佳,难以准确感知剧烈的球体旋转,反手对打也相对较弱。谷歌DeepMind分享了一段演示视频,其中显示AI智能体因为很难对快速回球做出及时反应,被高水平球员轻松得分。不过,研究团队正在积极着手解决这些问题。他们提出了一些方案:“为了解决阻碍机器人对快球反应时间的延迟限制,我们建议研究先进的控制算法和硬件优化,可能包括探索预测模型来预判球的轨迹,或者在机器人的传感器与执行器之间实现更快速的通信协议。”

谷歌DeepMind的AI智能体分析人类球员的视频。

DeepMind研究团队强调,随着成果的进一步完善,他们相信这套系统未来有望与高水平乒乓球运动员一较高下。毕竟,在开发能击败人类选手的AI模型方面,DeepMind经验丰富——无论是围棋界的大魔王AlphaZero,还是AlphaGo。国际象棋与智能问答的桂冠已经落入AI手中,也许乒乓球就是下一个目标。

最后,研究人员表示,这位机器人乒乓球“神童”的影响绝不仅限于乒乓球桌。为这个项目开发的技术,完全可以应用到各类需要快速反应并适应人类不可预测行为的机器人任务中,包括制造业和医疗保健领域。从这个角度来看,一枚小小的乒乓球,或许正在推开一扇更大的门。

来源:https://www.aiagiai.com/2467.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
批处理BAT入门教程第一篇

批处理BAT入门教程第一篇

提供13个批处理实战技巧,覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景,可一键完成系统维护与文件管理工作,极大提升自动化操作效率和便捷性。

时间:2026-07-03 16:15
从零开始批处理命令For循环详解与实战案例

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名; r递归搜索指定路径及其子目录中的文件; l生成数值序列; f可解析文件、字符串或命令输出,通过delims、tokens、skip、eol等选项灵活处理内容。

时间:2026-07-03 16:14
批评你的人是你生命中的贵人

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜,因为他们关注你、助你成长。面对批评应包容反思,用行动改进而非辩解。接受批评是自我完善的过程,能让人少走弯路,避免重复犯错。这样的人正是生命中的贵人,值得感恩与珍惜。

时间:2026-07-03 16:14
测试人员角色定位与职责详解

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变,最终核心职责是提供关键信息,协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态,而非单纯把关或追求完美。

时间:2026-07-03 16:14
经营成功测试生涯的实用方法与策略

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年,我在田纳西大学攻读研究生时,意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择,说起来还有些戏剧性——某个早晨,教授质问我为何缺席那么多开发会议,我解释说这些会议总是安排在周末早上,对我这个第一次离家、刚入学的学生来说实在不便。结果呢?等待我的不是解聘通

时间:2026-07-03 16:14
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜