卓驭于贝贝:向物理AI转型,是生存法则的必然选择 | 最前线
卓驭于贝贝:向物理AI转型,是生存法则的必然选择 | 最前线
文|肖漫
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

编辑|李勤
在今天的智能汽车圈,“物理AI”已经从一个前沿概念变成了高频热词。环顾四周,绝大多数智能驾驶算法厂商都在朝这个方向转型。
北京车展上,卓驭科技发布了面向移动物理AI的原生多模态基础模型。谈及这股转型浪潮,卓驭科技副总裁于贝贝的观点很明确:这绝非为了迎合资本市场而编织的想象空间,而是一条关乎厂商存亡的生存法则。
“如果不上这条技术路线,很可能今后就跑不出来了。”于贝贝坦言。
新的竞争维度已然打开。算法厂商的对手,不再仅仅是昔日的同行,更包括了从数字AI领域跨界而来的巨头,以及一众具身智能公司。
这场全新的竞赛,无异于将算法厂商推入一个全新维度的淘汰赛。而最终能跑出来的玩家,其商业空间也将随之彻底打开。
基于移动基座模型,卓驭正尝试打破传统Tier 1“卖硬件、收开发费”的单一商业逻辑。在其规划的第二增长曲线中,通过将乘用车验证过的技术拓展至Robotaxi、RoboVan等L4级领域,一种基于订阅、利润分成乃至“动作令牌(Action Token)”的新商业形态正在探索中。
近期,36氪汽车与卓驭科技副总裁于贝贝进行了一场对话,深入探讨了物理AI的底层逻辑、商业化可能性,以及在这场即将到来的淘汰赛中,卓驭如何构筑自身的护城河。
以下是经过编辑的对话实录:
36氪:能否详细介绍一下原生多模态基础模型?
于贝贝:谈到“原生多模态”,这个概念可以追溯到去年我们启动VLA 1.0项目的时候。当时的做法,更接近于一种视觉与动作对齐的模型,大语言模型是后来附加上去的。这种方式带来不少问题,比如对语言和语义的理解存在局限,响应也有延迟。
把所有信息都转译到语言空间里去理解,再试图通过语言转译的结果去理解物理世界——这种做法,其实有点反常识。
更合理的路径应该是怎样的?视觉、音频、动作各自都是一个模态,规则或推理同样可以视为一个模态。这些都应该在预训练阶段就一并加入,让模型能够天生地、在一个多种模态融合的共同空间里去理解物理世界。这才是更接近本质的做法。
36氪:现在有把语言模态拿掉吗?
于贝贝:目前我们车端的模型,确实还没有开放语言这一路的输入。这和小鹏发布的VLA 2.0思路类似,大家都在朝这个新范式切换,底层的骨干网络已经发生了改变。
36氪:卓驭也进入了VLA2.0的阶段?
于贝贝:是的。整个业界正处在一个范式切换的转折点上。摆在面前的选择很清晰:是沿着过去做专家模型这类小模型的范式继续走下去,还是果断切换到大模型的范式上来?
我们更看好大模型的范式。放在移动物理AI的语境下看,如果希望移动能力能在各种各样的载具上通用,这本质上就进入了规模化应用的阶段。
回顾大语言模型的发展史,当初做视觉语言模型时,也有人做专家模型,有人做通用模型,也就是所谓的基座模型。结果呢?最终跑出来的,是做基座模型的那一批。以前那些专注于特定领域(比如看病)的专家模型,其实都没能真正跑出来。在物理AI领域,我们相信技术演进的规律是相通的,因此也会坚定地走基础模型的路线。
36氪:很多厂商都在这么做,但目前似乎还没能真正训练出一个可以让各种不同载体统一接入的模型,本质上大家仍然是在解决车上的问题。
于贝贝:这需要一个分阶段推进的过程。到了2025年,行业基本都切换到了数据驱动的模式,这意味着模型的基础能力大概达到了70分的水平。这时候,想把它提升到90分,那20分的差距仍然需要靠后训练、数据采集和泛化来实现,但提升的难度,已经从当初的40分到80分,缩小为现在的70分到90分。
后续,随着模型基础能力继续提高,目标肯定是实现零样本泛化,也就是常说的“开箱即用”。
试想,如果模型能力开箱就能达到95分,那么后续的后训练、泛化、开城等工作几乎可以忽略不计。虽然现在距离开箱95分还有距离,但开箱70分的水平已经达到了。
36氪:在现阶段,卓驭是否已经把各种场景都统一到同一个模型里实际运行过了,并认为它已经可以在各个领域都量产且实现泛化,还是说处于一个比较早期的阶段?
于贝贝:在这个时间节点,远谈不上已经做到了开箱即用。究竟什么才是物理AI最终的终极范式?什么样的架构才能真正理解物理世界?目前业界还没有定论。
36氪:您怎么看待当前大多数方案厂商都在向物理AI方向转型的现象?这是不是向资本市场讲一个更有想象空间的故事?
于贝贝:我们认为,这已经不单单是商业或战略上的选择,最终会上升为一种生存法则层面的事情。如果不上这条技术路线,很可能今后就跑不出来了。
这和大语言模型爆发的前夜很像。当年涌现出很多垂直领域的专家模型,但通用大模型一出来,就把它们都替代掉了,以前的那些最终都没有跑出来。
36氪:在这个范式下做一个通用模型,但在其他场景下的数据,或者其他前期训练所需的条件,是不是还不够充分?
于贝贝:我们现在训练自己的基础模型,数据构成大致是:30%来自车辆采集的真实数据,30%来自机器人,另外40%来自互联网。
移动能力相关的数据,在互联网上其实并不难找。只需要获取第一人称视角的、在移动中拍摄的视频就行,不一定非得是乘用车或商用车,甚至人走路时拍摄的视频也可以。这类数据的规模非常庞大,获取相对容易。
很多企业都宣称要做移动物理AI。模型能力固然重要,但更关键的一点在于:具身智能必须部署到具体的硬件上,而它的分发过程其实非常困难。它不像数字AI,可以通过手机实现一传十、十传百的病毒式传播,迅速覆盖上亿用户。
所以,建立一个高效的分发平台和分发网络,同样是关键的一环。这关乎如何把这种能力具体地部署到移动载具、部署到物理实体上。
36氪:卓驭在分发上是怎么做的?
于贝贝:我们有自己的一套方法论。例如,与合作伙伴共同定义硬件标准,标准确立后,通过合作伙伴进行硬件授权与分发,这属于硬件分发的部分。
软件分发方面,比如我们的移动能力SDK,可以将模型能力封装成SDK,提供给那些不具备后训练模型能力的合作伙伴使用。也可以将其包装成“移动AI”,也就是把模型做得足够好之后,将其开源,让其他方可以基于这个模型去做后训练,这又是一种分发方式。
还可以直接做成“移动智能体”。未来对于一些低安全、低实时性要求的应用,比如扫地机器人或割草机,只需要把视频流传输到云端,由云端计算好之后,直接下发一条轨迹指令给设备,这或许就是另一种分发形态了。
36氪:这几种分发的方式,是否对应着卓驭的商业收费模式?
于贝贝:是的,而且它们面向的商业场景也各不相同。
传统的方式,像做乘用车或商用车,就是销售硬件、销售软件许可,并收取开发费和非重复性工程费用,这部分我们内部称作第一增长曲线的业务。
第二增长曲线,则是将乘用车上已经验证过的技术,拓展到Robotaxi、RoboVan等L4级领域。虽然也可能卖硬件、收开发费,但一般不收取软件许可费。
软件部分的收益,是通过利润分成来获取的。以L4级业务为例,作为服务提供方,需要持续参与软件的迭代,甚至要参与到实际运营中去,因此需要一个持续性的收入来源,这就演变成了订阅和分润的模式。
36氪:听起来第二增长曲线更挣钱。
于贝贝:相比第一增长曲线的收入,其利润结构确实要更好一些。
我们可能会有不同的算法分发方式。以“移动智能体”为例,这种分发方式有点像在分发所谓的“动作令牌”。
相当于某个消费级电子设备将视频流传输给云端推理模型,模型再下发一条轨迹指令,其收费模式可能就是按照该设备的使用次数、行驶里程来收取类似“动作令牌”的费用,这又是另一种形式的订阅。
36氪:后续运维各方面的东西,都是卓驭来做吗?
于贝贝:对于L2级系统,本身不涉及运维。只有到了L4级别才涉及运维,需要有一个远程监控系统,始终监控车辆的运行过程,在必要时进行远程接管。
这有点像过去的安吉星服务,使用这个服务是需要交费的。一旦车辆启用了L4功能,无论是干线物流还是乘用车,只要启用,就需要额外交一部分费用。
甚至未来,当乘用车的传感器配置、算力配置都能够支持L4级别时,平时车主可能还是使用L2+系统。当他需要启用L4功能时,就需要为L4模式下每公里的行驶,额外支付一点费用,因为始终会有一个系统在后台监控着它。
36氪:你认为L2和L4会是完全不一样的商业模式?
于贝贝:没错,L2和L4是完全不同的商业模式。从工程安全的角度来看,同样性质的一个事故,在高速上产生的伤害程度,要远比在城区严重得多。
36氪:行业玩家都在往物理AI方向做,这是新一轮淘汰赛的开始吗?
于贝贝:新一轮的行业洗牌可能即将开始。可以预见,所有做自动驾驶的公司,都会在不久的将来,转变为移动物理AI公司。
如果在移动物理AI这个赛道上竞争,这本身就变成了一种跨界竞争。对手可能不再是行业内的既有玩家,还需要和那些本来做数字AI、现在也想转型做具身智能和物理AI的玩家去竞争。
36氪:那卓驭的护城河究竟是什么?
于贝贝:我们认为核心有两点。第一,是模型能力本身。现在大家的迭代范式,乃至最终会采用什么样的模型架构,都还没有定论。也许未来更高级的3D DiT或V-JEPA等全新架构会跑出来,但这些目前都是未知数。
第二,分发能力其实是一个非常高的门槛。如何建立一个高效的分发平台和分发网络,创建一个生态,联合不同的合作伙伴共同进行分发,这一定是一个极高的壁垒。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
华大基因估值有望打开:智能化重构内核,全球化打开疆界
当资本市场还在热议AI大模型如何碘伏认知时,一场更为深刻的变革已在生物医疗领域暗流涌动 体外诊断(IVD)行业,这个曾一路高歌的赛道,眼下正普遍经历着量价承压、增长失速的结构性阵痛。然而,华大基因(300676 SZ)的最新财报数据,却为这片迷雾笼罩的市场投下了一抹亮色:2026年一季度,公司实现营
A股成交额突破三万亿创阶段新高存储芯片与算力股强势领涨
格隆汇5月6日|A股三大指数今日集体走高 市场今日迎来普涨行情,三大指数集体上扬。截至收盘,沪指上涨1 17%,报收于4160点;深证成指表现更为强劲,涨幅达到2 33%,创下超过5年来的新高;创业板指同样气势如虹,大涨2 75%,创出近11年新高;科创50指数更是以5 47%的涨幅领跑。全市场成交
小米昆仑N3路试谍照曝光方正造型大电池增程SUV将于下半年发布
疑似小米“SKYNOMAD”谍照曝光,硬派全尺寸SUV即将登场? 最近,汽车圈被一组谍照搅动了。微博博主@SugarDesign放出的图片,据信正是小米旗下首款增程全尺寸SUV,内部代号“昆仑N3”,外界称之为“SKYNOMAD(寻天)”。消息称,这款车定位将低于小米主品牌,并且不会悬挂小米车标,瞄
Momenta曹旭东:自动驾驶是物理AI的序章
导读:当智能驾驶进入大模型时代,真正的壁垒到底是什么? 【文 观察者网 周盛明 编辑 高莘】 体系能力:超越单点算法的竞争核心 2026年北京车展期间,Momenta在“Momenta R7,物理AI序章”主题分享会上宣布,其R7强化学习世界模型实现量产首发。随后的媒体对话中,CEO曹旭东进一步阐释
抢滩“具身智能”高地!Meta(META.US)收购ARI加码人形机器人布局 与特斯拉、谷歌展开正面对决
抢滩“具身智能”高地!Meta(META US)收购ARI加码人形机器人布局 与特斯拉、谷歌展开正面对决 智通财经APP获悉,Meta Platforms Inc (META US)近日宣布,已收购机器人人工智能(AI)初创公司Assured Robot Intelligence(ARI),标志着这
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

