伯克利Allen Yang博士：物理AI仍未到分水岭时刻

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

伯克利Allen Yang博士：物理AI仍未到分水岭时刻

热心网友时间：2026-01-11

转载

加州大学伯克利Dr. Allen Yang

当前，人工智能行业正深陷 “GPU 竞赛” 的热潮，在2026年CES（国际消费电子展）现场随处可见对云端 AI 应用的热议，“人均GPU 数量” 成为衡量技术实力的热门指标，从企业到国家层面都在追逐算力的堆砌。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

美西时间1月6日-8日，钛媒体CES 2026「Talk to the World」系列论坛在拉斯维加斯举办。会上，加州大学伯克利分校Vive 增强现实中心创始执行主任Dr. Allen Yang提出了一个清醒而关键的观点：我们应超越云端，将目光投向物理世界，探寻物理 AI 的下一个 “AlphaGo时刻”。

作为伯克利 Vive 增强现实中心创始执行主任，Dr. Allen Yang主导着 AR/VR、元宇宙及赛车自动驾驶三大创新方向。过去四年，他带领伯克利 AI 赛车队连续征战 CES 自动驾驶挑战赛，并在 2025 年斩获头对头超车项目冠军。这些扎根物理场景的实践让他深刻意识到，物理 AI 与依赖云端数据的大型语言模型有着本质区别，其真正的 “分水岭时刻” 尚未到来。

他指出，虽然以AlphaGo和大型语言模型为代表的AI已取得里程碑式突破，但物理AI仍亟待属于自己的“分水岭时刻”。其挑战并非源于算力不足，而是根植于物理世界独特的复杂性。

首先，物理AI极度缺乏覆盖所有极端场景的训练数据。不同于语言模型可汲取数十年互联网的养分，现实世界中的“边缘案例”——如罕见的天气、突发障碍物、极端的机械故障——难以被穷尽采集。

其次，毫秒级的实时响应是生命线。在高速行驶或紧急救援中，决策延迟意味着失败甚至灾难。一个开源项目“LLM Colosseum”的实验生动地证明了这一点：在《街头霸王》游戏中，虽然小模型单次决策精度较低，但其高频的决策速度能使其战胜响应缓慢的大型模型。这印证了那句古老的格言：完美是优秀的敌人。

再次，众多前沿场景中“云端”是缺席的。无论是月球探索、矿难救援，还是火灾现场，稳定、高速的网络连接都是奢望。在这些领域，部署在设备本地的“边缘AI”是唯一可行的智能。

为攻克这些挑战，Dr. Allen Yang的团队选择在最具挑战性的赛道上进行实战——高速自动驾驶赛车。

在 2025 年 CES 自动驾驶挑战赛中，赛车实现 140 英里 / 小时的全自主行驶，伯克利车队更是以 163 英里 / 小时的速度完成超车。当普渡大学赛车尝试反超时，两车因弯道漂移打破 2-5 米安全距离，双双自动紧急制动，这一场景反映出，在动态、高速的物理交互中，AI系统不仅需进行复杂的实时感知与规划，更必须在安全规则与竞争目标之间做出平衡。此后，他们又将赛道延伸至中国张家界天门山。这条全长10.77公里、拥有99道弯的山路，为自动驾驶系统提供了包含陡坡、急弯与多变天气的综合测试场。清华大学、浙江大学等九所国内高校参与了相关项目。

2026年，Dr. Allen Yang进一步宣布，将在原有赛事基础上增设天门山人形机器人挑战赛，邀请研发机构测试机器人在非结构化地形——如攀登999级台阶——中的移动与决策能力。他表示，物理AI的进展不仅依赖于算法与硬件的迭代，也有赖于跨学科协作与在真实场景中持续积累的经验。在极端环境下的技术实践与人才培养，或将为行业带来新的启发。

以下为Dr. Allen Yang演讲全文，经钛媒体编辑：

大家好，欢迎大家来到CES，我是Dr. Allen Yang。首先感谢钛媒体的邀请，如今 CES 上到处都在谈论基于云的人工智能应用。我也听说，当人们寻找下一个酷炫的人工智能应用时，每个人都在问的一个问题是关于这个叫做GPP的新东西，我刚刚才知道这是指一家公司里人均拥有多少个 GPU。所以拥有的 GPU 越多，似乎就越强大，甚至有人在问一个国家能有多少个 GPU 来推动应用的发展。但今天我想邀请大家把目光超越云端，探寻物理人工智能领域的下一个“AlphaGo时刻”。

先简单介绍一下我自己。今年 2026 年对我来说也是个不错的年份，因为我已在加州大学伯克利分校工作了 20 年。在伯克利，我目前是 Vive 增强现实中心创始执行主任，之前曾是冯氏工程领导力研究院的首席科学家。我很自豪能在三个领域引领创新：第一个是增强现实 / 虚拟现实（AR/VR），第二个是元宇宙（Metaphors），第三个是赛车应用中的自动驾驶技术。

今年回到 CES，对我来说是个五味杂陈的时刻，因为这让我想起，在过去的四年里，我们一直带领伯克利人工智能赛车队连续参加自动驾驶挑战赛。过去四年的 CES 都有我们的身影。特别是在去年 2025 年 CES 上，伯克利人工智能赛车队赢得了头对头超车项目的冠军。

今天，我想谈谈物理人工智能。之所以伯克利以及许多与我们竞争的大学会投身其中，是因为我们想培育下一个 “分水岭时刻”。

这些分水岭时刻对培养未来的人工智能用户至关重要，而且大家都知道，到目前为止，人工智能创新无疑是吸引数百万用户速度最快的技术，对吧？这其实要归功于人工智能过去的分水岭时刻，比如 IBM 研发的 “深蓝”、DeepMind 研发的 “AlphaGo”。

现在，每个人都知道强化学习，在过去三年里，大型语言模型也应运而生。所以，在来 CES 准备PPT之前，我本打算说服大家，物理人工智能仍在等待属于它的黄金时刻，也就是它自己的分水岭时刻。

为什么这么说呢？第一个原因是，尽管强化学习造就了世界上最厉害的围棋选手，能击败所有围棋大师。但现在，如果你和自动驾驶公司交流就会发现，仅靠强化学习，还不足以打造出像人类一样擅长驾驶的自动驾驶系统。

一个关键的例子就是我们惨痛经历过的 “Beta 三时刻”。在这里，我准备了一段短视频，向大家展示伯克利人工智能赛车队过去经历的一个关键失败时刻。

这段视频会让大家看到我们学到的东西，以及我们在伯克利和许多大学里，认真教给最优秀学生的知识。当我们把这些理论应用到高速人工智能赛车的现实世界中时，我们发现，课本上的知识往往无法直接奏效。

（视频播放）

这是 2024 年在印第安纳赛车场，伯克利对阵圣母大学（Uni More，结合语境推测）的一段短视频。接下来，大家就会明白我在说什么了。

当时发生了什么呢？

在这场比赛之前，印第安纳赛车场遭遇了特大暴雨，由于云层厚重，GPS 卫星信号丢失。我们的赛车系统在那一刻决定将定位源信号从一个系统切换到另一个系统。这些混合系统的不一致性，导致我们的控制算法选择了错误的行驶曲率，而不是正确的那条。这恰恰说明，当我们谈论物理人工智能时，它实际上是理论与实践、科学与工程的深度结合。

在来 CES 之前，我还准备了第二个理由，想说服大家物理人工智能的分水岭时刻尚未到来。

我的第二个论点是，行为智能似乎比语言智能更基础。

在座有孩子的各位可能都能理解，人类婴儿在学会用母语描述世界之前，就已经会通过行动去探索未知的世界了。但现在，在CES 上，多亏了黄仁勋的主题演讲，我们知道英伟达已经全面进军物理人工智能的新时代。所以，我觉得他们帮我省去了很多说服大家的功夫。

我想，在 CES 上，大家已经听说了很多很棒的新工具，它们能帮你获得更多 GPU、更大内存，还能实现更长的思考过程。或许你还会用到混合专家模型（Mixture of Experts）、思维链（Chain of Thoughts），让你的 GPT 模型思考得更聪明、更深入。不过，抛开这些优秀的工具，我想针对物理人工智能补充几个观察结论。

第一，物理人工智能需要更多的极端边缘案例。

为什么这么说呢？当我们为大型语言模型增加更多 GPU 时，强大的计算平台本身就能让 GPT 模型变得更聪明。为什么？因为所有的 GPT 模型都从互联网获取知识。

自互联网泡沫以来的 30 年里，互联网几乎已经涵盖了所有的边缘案例、世界上所有的语言，你只需编写一个脚本就能爬取互联网上的这些数据。事实上，你甚至可以说，互联网为语言模型准备的内容太多了。有时候，我们的人工智能模型会从这些数据中学习到不良内容。这就像我们必须向孩子屏蔽那些不好的语言，避免他们学到一样。

但如果切换到物理人工智能领域，很容易就能明白，如今没有任何一家物理人工智能公司能声称，他们已经积累了足够多的物理人工智能数据，涵盖了所有的极端边缘案例。

我想分享的第二个观察结论是，除了需要覆盖所有边缘案例，物理人工智能还要求极高的毫秒级低延迟性能。

对于 GPT 模型来说，增加更多 GPU 会消耗更多能源、更多时间，这也会导致订阅费用更高，对吧？所以，你要为你的算力、云服务、使用时长支付更多费用。但在物理人工智能领域，情况并非如此 —— 为更大的模型支付更多费用，并不一定能带来成功的解决方案。

我给大家举个例子。

有一个名为 “LLM Colosseum” 的开源项目，在这个项目中，作者们对接了不同类型的语言模型，让它们操控游戏角色玩《街头霸王 3》。比如，在这段视频中，你可以让 ChatGPT 操控红色的角色。你也可以让另一个可能更小的模型，比如 Mistral，操控绿色的角色。

然而，实验结果出来后，相当令人惊讶 —— 或者说，取决于你的视角，也可能并不惊讶。“LLM Colosseum” 的实验发现，虽然小型模型的单次推理精度较低，但它们每秒、每分钟能进行更快的推理，做出的决策数量也比大型语言模型多得多。

换句话说，英语中有句老话 “完美是优秀的敌人”，在物理人工智能领域，你宁愿每秒获得 50 次、100 次（或赫兹级）的不完美决策，也不愿用一个庞大的大型模型，每秒只能进行 1 到 2 次完美决策。在这种情况下，小型模型实际上会比大型模型表现更好。

我想分享的第三个观察结论是，在更多前沿应用场景中，月球上可没有云端，所以你根本没有机会为你的云端和互联网搭建现代化的基础设施。这些前沿应用包括火灾救援。当发生火灾、你的房子被烧毁、整个社区都被烧毁时，你怎么可能还能用上互联网呢？这还包括油气勘探、采矿作业。

当然，当我们考虑帮助美国国家航空航天局（NASA）将宇航员送往月球和火星时，我们如何打造出能容纳整个机构所有知识的智能宇航服？但与此同时，我们不可能先在月球或火星上搭建云端。月球上没有云端。

总而言之，我今天想和大家分享的观点是，除了寻找能提供更多 GPU、更大内存、更长思考过程（比如下一个思维链技术）的优秀新工具，我们还必须把目光超越云端，将物理人工智能视为下一个前沿领域。

为什么？有三个原因。

第一，边缘案例与安全对人类用户至关重要。