卓驭于贝贝：向物理AI转型，是生存法则的必然选择

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

卓驭于贝贝：向物理AI转型，是生存法则的必然选择 | 最前线

热心网友时间：2026-05-06

转载

卓驭于贝贝：向物理AI转型，是生存法则的必然选择 | 最前线

文｜肖漫

卓驭于贝贝：向物理AI转型，是生存法则的必然选择

编辑｜李勤

在今天的智能汽车圈，“物理AI”已经从一个前沿概念变成了高频热词。环顾四周，绝大多数智能驾驶算法厂商都在朝这个方向转型。

北京车展上，卓驭科技发布了面向移动物理AI的原生多模态基础模型。谈及这股转型浪潮，卓驭科技副总裁于贝贝的观点很明确：这绝非为了迎合资本市场而编织的想象空间，而是一条关乎厂商存亡的生存法则。

“如果不上这条技术路线，很可能今后就跑不出来了。”于贝贝坦言。

新的竞争维度已然打开。算法厂商的对手，不再仅仅是昔日的同行，更包括了从数字AI领域跨界而来的巨头，以及一众具身智能公司。

这场全新的竞赛，无异于将算法厂商推入一个全新维度的淘汰赛。而最终能跑出来的玩家，其商业空间也将随之彻底打开。

基于移动基座模型，卓驭正尝试打破传统Tier 1“卖硬件、收开发费”的单一商业逻辑。在其规划的第二增长曲线中，通过将乘用车验证过的技术拓展至Robotaxi、RoboVan等L4级领域，一种基于订阅、利润分成乃至“动作令牌（Action Token）”的新商业形态正在探索中。

近期，36氪汽车与卓驭科技副总裁于贝贝进行了一场对话，深入探讨了物理AI的底层逻辑、商业化可能性，以及在这场即将到来的淘汰赛中，卓驭如何构筑自身的护城河。

以下是经过编辑的对话实录：

36氪：能否详细介绍一下原生多模态基础模型？

于贝贝：谈到“原生多模态”，这个概念可以追溯到去年我们启动VLA 1.0项目的时候。当时的做法，更接近于一种视觉与动作对齐的模型，大语言模型是后来附加上去的。这种方式带来不少问题，比如对语言和语义的理解存在局限，响应也有延迟。

把所有信息都转译到语言空间里去理解，再试图通过语言转译的结果去理解物理世界——这种做法，其实有点反常识。

更合理的路径应该是怎样的？视觉、音频、动作各自都是一个模态，规则或推理同样可以视为一个模态。这些都应该在预训练阶段就一并加入，让模型能够天生地、在一个多种模态融合的共同空间里去理解物理世界。这才是更接近本质的做法。

36氪：现在有把语言模态拿掉吗？

于贝贝：目前我们车端的模型，确实还没有开放语言这一路的输入。这和小鹏发布的VLA 2.0思路类似，大家都在朝这个新范式切换，底层的骨干网络已经发生了改变。

36氪：卓驭也进入了VLA2.0的阶段？

于贝贝：是的。整个业界正处在一个范式切换的转折点上。摆在面前的选择很清晰：是沿着过去做专家模型这类小模型的范式继续走下去，还是果断切换到大模型的范式上来？

我们更看好大模型的范式。放在移动物理AI的语境下看，如果希望移动能力能在各种各样的载具上通用，这本质上就进入了规模化应用的阶段。

回顾大语言模型的发展史，当初做视觉语言模型时，也有人做专家模型，有人做通用模型，也就是所谓的基座模型。结果呢？最终跑出来的，是做基座模型的那一批。以前那些专注于特定领域（比如看病）的专家模型，其实都没能真正跑出来。在物理AI领域，我们相信技术演进的规律是相通的，因此也会坚定地走基础模型的路线。

36氪：很多厂商都在这么做，但目前似乎还没能真正训练出一个可以让各种不同载体统一接入的模型，本质上大家仍然是在解决车上的问题。

于贝贝：这需要一个分阶段推进的过程。到了2025年，行业基本都切换到了数据驱动的模式，这意味着模型的基础能力大概达到了70分的水平。这时候，想把它提升到90分，那20分的差距仍然需要靠后训练、数据采集和泛化来实现，但提升的难度，已经从当初的40分到80分，缩小为现在的70分到90分。

后续，随着模型基础能力继续提高，目标肯定是实现零样本泛化，也就是常说的“开箱即用”。

试想，如果模型能力开箱就能达到95分，那么后续的后训练、泛化、开城等工作几乎可以忽略不计。虽然现在距离开箱95分还有距离，但开箱70分的水平已经达到了。

36氪：在现阶段，卓驭是否已经把各种场景都统一到同一个模型里实际运行过了，并认为它已经可以在各个领域都量产且实现泛化，还是说处于一个比较早期的阶段？

于贝贝：在这个时间节点，远谈不上已经做到了开箱即用。究竟什么才是物理AI最终的终极范式？什么样的架构才能真正理解物理世界？目前业界还没有定论。

36氪：您怎么看待当前大多数方案厂商都在向物理AI方向转型的现象？这是不是向资本市场讲一个更有想象空间的故事？

于贝贝：我们认为，这已经不单单是商业或战略上的选择，最终会上升为一种生存法则层面的事情。如果不上这条技术路线，很可能今后就跑不出来了。

这和大语言模型爆发的前夜很像。当年涌现出很多垂直领域的专家模型，但通用大模型一出来，就把它们都替代掉了，以前的那些最终都没有跑出来。

36氪：在这个范式下做一个通用模型，但在其他场景下的数据，或者其他前期训练所需的条件，是不是还不够充分？

于贝贝：我们现在训练自己的基础模型，数据构成大致是：30%来自车辆采集的真实数据，30%来自机器人，另外40%来自互联网。

移动能力相关的数据，在互联网上其实并不难找。只需要获取第一人称视角的、在移动中拍摄的视频就行，不一定非得是乘用车或商用车，甚至人走路时拍摄的视频也可以。这类数据的规模非常庞大，获取相对容易。

很多企业都宣称要做移动物理AI。模型能力固然重要，但更关键的一点在于：具身智能必须部署到具体的硬件上，而它的分发过程其实非常困难。它不像数字AI，可以通过手机实现一传十、十传百的病毒式传播，迅速覆盖上亿用户。

所以，建立一个高效的分发平台和分发网络，同样是关键的一环。这关乎如何把这种能力具体地部署到移动载具、部署到物理实体上。

36氪：卓驭在分发上是怎么做的？

于贝贝：我们有自己的一套方法论。例如，与合作伙伴共同定义硬件标准，标准确立后，通过合作伙伴进行硬件授权与分发，这属于硬件分发的部分。

软件分发方面，比如我们的移动能力SDK，可以将模型能力封装成SDK，提供给那些不具备后训练模型能力的合作伙伴使用。也可以将其包装成“移动AI”，也就是把模型做得足够好之后，将其开源，让其他方可以基于这个模型去做后训练，这又是一种分发方式。

还可以直接做成“移动智能体”。未来对于一些低安全、低实时性要求的应用，比如扫地机器人或割草机，只需要把视频流传输到云端，由云端计算好之后，直接下发一条轨迹指令给设备，这或许就是另一种分发形态了。

36氪：这几种分发的方式，是否对应着卓驭的商业收费模式？

于贝贝：是的，而且它们面向的商业场景也各不相同。

传统的方式，像做乘用车或商用车，就是销售硬件、销售软件许可，并收取开发费和非重复性工程费用，这部分我们内部称作第一增长曲线的业务。

第二增长曲线，则是将乘用车上已经验证过的技术，拓展到Robotaxi、RoboVan等L4级领域。虽然也可能卖硬件、收开发费，但一般不收取软件许可费。

软件部分的收益，是通过利润分成来获取的。以L4级业务为例，作为服务提供方，需要持续参与软件的迭代，甚至要参与到实际运营中去，因此需要一个持续性的收入来源，这就演变成了订阅和分润的模式。

36氪：听起来第二增长曲线更挣钱。

于贝贝：相比第一增长曲线的收入，其利润结构确实要更好一些。

我们可能会有不同的算法分发方式。以“移动智能体”为例，这种分发方式有点像在分发所谓的“动作令牌”。

相当于某个消费级电子设备将视频流传输给云端推理模型，模型再下发一条轨迹指令，其收费模式可能就是按照该设备的使用次数、行驶里程来收取类似“动作令牌”的费用，这又是另一种形式的订阅。

36氪：后续运维各方面的东西，都是卓驭来做吗？

于贝贝：对于L2级系统，本身不涉及运维。只有到了L4级别才涉及运维，需要有一个远程监控系统，始终监控车辆的运行过程，在必要时进行远程接管。

这有点像过去的安吉星服务，使用这个服务是需要交费的。一旦车辆启用了L4功能，无论是干线物流还是乘用车，只要启用，就需要额外交一部分费用。

甚至未来，当乘用车的传感器配置、算力配置都能够支持L4级别时，平时车主可能还是使用L2+系统。当他需要启用L4功能时，就需要为L4模式下每公里的行驶，额外支付一点费用，因为始终会有一个系统在后台监控着它。

36氪：你认为L2和L4会是完全不一样的商业模式？

于贝贝：没错，L2和L4是完全不同的商业模式。从工程安全的角度来看，同样性质的一个事故，在高速上产生的伤害程度，要远比在城区严重得多。

36氪：行业玩家都在往物理AI方向做，这是新一轮淘汰赛的开始吗？

于贝贝：新一轮的行业洗牌可能即将开始。可以预见，所有做自动驾驶的公司，都会在不久的将来，转变为移动物理AI公司。

如果在移动物理AI这个赛道上竞争，这本身就变成了一种跨界竞争。对手可能不再是行业内的既有玩家，还需要和那些本来做数字AI、现在也想转型做具身智能和物理AI的玩家去竞争。

36氪：那卓驭的护城河究竟是什么？

于贝贝：我们认为核心有两点。第一，是模型能力本身。现在大家的迭代范式，乃至最终会采用什么样的模型架构，都还没有定论。也许未来更高级的3D DiT或V-JEPA等全新架构会跑出来，但这些目前都是未知数。

第二，分发能力其实是一个非常高的门槛。如何建立一个高效的分发平台和分发网络，创建一个生态，联合不同的合作伙伴共同进行分发，这一定是一个极高的壁垒。

来源:https://www.163.com/dy/article/KRV2ADHA05118DFD.html

上一篇：绿色出行热度攀升多举措保障充电需求

下一篇：麻省理工AI专家警告：用自动化替代Z世代入门员工是“透支未来”

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

免费AI婴儿生成器在线工具

SnapMyBaby人工智能摄影师

基于人工智能的博伽梵歌教义灵性指导应用

Airpost.ai社交媒体营销人员推荐页工具

AI生成无限睡前故事与宝宝形象

每日AI洞见精选

XRP受稳定币法案利好飙升，4月RLUSD或引发大涨

AI智能分析孩子长相更像爸爸还是妈妈的应用

TRIPChatter AI旅行规划助手

Dokkio在线云文件协作工具

免费AI婴儿生成器在线工具

SnapMyBaby人工智能摄影师

基于人工智能的博伽梵歌教义灵性指导应用

Airpost.ai社交媒体营销人员推荐页工具

AI生成无限睡前故事与宝宝形象

每日AI洞见精选

XRP受稳定币法案利好飙升，4月RLUSD或引发大涨

AI智能分析孩子长相更像爸爸还是妈妈的应用

TRIPChatter AI旅行规划助手

Dokkio在线云文件协作工具

免费AI婴儿生成器在线工具

SnapMyBaby人工智能摄影师

基于人工智能的博伽梵歌教义灵性指导应用

Airpost.ai社交媒体营销人员推荐页工具

AI生成无限睡前故事与宝宝形象

每日AI洞见精选

XRP受稳定币法案利好飙升，4月RLUSD或引发大涨

AI智能分析孩子长相更像爸爸还是妈妈的应用

TRIPChatter AI旅行规划助手

Dokkio在线云文件协作工具

卓驭于贝贝：向物理AI转型，是生存法则的必然选择 | 最前线