对话王潜:一个月后机器人将进入家庭接单服务

“跑马拉松的机器人和我们,完全是两个领域。我们和做语言模型的公司,距离反而更近。”
就在不久前,一场机器人马拉松吸引了无数目光。那些拥有刀锋般双足的机器人,跑出了超越人类的速度。然而,在自变量科技CEO王潜看来,这更多是硬件能力的展示,而真正的战场,在于“大脑”。
“硬件在中国,从来都不是壁垒。今天做出一个,明天供应链就能跟上,后天大家都能做。”在与包括科技在内的媒体交流时,王潜直言不讳,“我们做的,本质上是基础模型的事,壁垒要高得多。”
4月21日,刚刚宣布完成B轮融资的自变量科技,抛出了一个更为激进的目标:35天后,新一代机器人将入驻真实家庭,开始提供服务。

发布会上,一台白色轮式双臂机器人缓缓滑上讲台。一只机械臂稳稳夹着垃圾桶,另一只则精准拾起了王潜演讲时随手扔下的纸团。这个简单的动作,背后是截然不同的机器人逻辑。
在王潜的设想中,未来的家庭机器人不应是预先编程、依赖遥控的“命令执行者”,而应成为能够自主行动的“新家庭成员”。这无疑是这个时代最棘手的技术难题之一。
核心瓶颈不在本体,而在智能。家庭环境,堪称最复杂的“考场”——没有预设剧本,猫随时跳上餐桌,拖鞋永远不会待在原地。面对这些随机的碎片化事件,传统机器人束手无策。
“现在的机器人硬件已经相当出色,双足、灵巧手、力控关节都很好。但大脑没有跟上,就像空有一身漂亮的肌肉。”王潜如此比喻。
他认为,当前业内主流的视觉-语言-动作(VLA)架构,本质是“三个模块在传话”,信息每传递一次就损耗一次。这种模型只能模仿训练数据中的动作轨迹,无法真正理解物理世界的底层规律,比如重力、摩擦力和惯性。
自变量的解决方案是彻底重构:从零开始,训练一个基于世界统一模型架构的原生大脑。他们将其命名为WALL-B,并称之为全球首个基于此架构的具身智能基础模型。搭载这一模型的机器人,将在下个月走进家庭。

在应用层面,自变量已与58同城达成合作。届时,搭载WALL-AS模型的机器人将进入真实家庭,与保洁阿姨协同作业。这很可能成为全球首次机器人在复杂家庭环境中服务人类日常生活的规模化落地尝试。
“5月份进家时,理论上它能处理所有我们指令范围内、物理上可触及的事情。”王潜向科技解释道,“当然,这不代表100%完全自主,必要时仍需人类进行远程监管兜底,这是安全底线。”
对于行业竞争格局,王潜的判断是:“OpenAI领先Google大约两年,而在机器人领域,这个时间窗口会更长,可能还有三年以上。”即便巨头纷纷入场,创业公司依然握有机会。
发布会后,王潜与公司CTO王昊就机器人进家落地、技术路径与行业竞争等话题,接受了科技等媒体的采访。以下为经过精编的对话实录:
谈机器人进家落地:“这是一个占GDP20%规模的巨大市场”
Q:机器人进家后,是否有阶段性的能力提升目标?
王潜:我们希望机器人在进家的第一天,就能承担大部分家务。初期或许不够完美,但目标是让它通过持续操作和学习,尽快成长为完全自主的家庭助手。
Q:行业有种观点认为,机器人必须足够“通用”才有进家的价值。您如何看待现阶段的通用性?实现全能型家庭助手的时间表是怎样的?
王潜:是的,通用性是关键。5月进家的版本,理论上能完成所有指令内且物理可达的任务。但必须强调,安全至上,100%的AI自主并非当前目标,远程人机协同监管是必要环节。
王昊:家庭场景的特点在于,没有单一的高频任务,却充斥着大量琐碎的长尾需求——摆鞋、叠衣、铲猫砂等等。过去机器人进家“无用武之地”,正是因为没有一个能处理多任务的机器人。当它能覆盖这些碎片化需求时,集合起来就是一个巨大的市场。我们的目标就是处理好这些长尾任务。
Q:所以5月的进家服务,是确定的商业服务,而非技术演示?
王潜:是的。这将是通过58到家平台提供的付费服务,用户可以在APP上自由下单。它不是预设好的演示,而是面向公众的正式服务。
Q:未来几年,在应用落地规模上有何目标?
王潜:我们更倾向于用技术里程碑来思考。希望在2-3年内,实现物理世界的“ChatGPT时刻”,成为那个引爆点的创造者。
Q:与58同城的合作中,如果用户下单,是否需要工作人员现场陪同?
王潜:目前现场已不需要员工实时支持了,模式是“一位保洁阿姨+一台机器人”协同进家。机器人在其能力范围内自主工作,阿姨主要处理物理上无法触及的情况(如过道太窄)。但后台有远程接管机制,类似自动驾驶中的安全员角色,当机器人遇到难题时会请求介入,解决后再交还AI。
Q:家庭机器人瞄准的市场规模究竟有多大?
王潜:如果仅看家庭场景,根据历史经济学测算,家务劳动约占GDP的20%。人们每天花在家务上的时间,大约是工作时间的1/4到1/5。这无疑是一个极其庞大的市场。
Q:机器人的预期价格如何?能否让普通家庭负担?
王潜:当机器人广泛进入家庭时,我们的愿景是让所有家庭都用得起。价格会有区间,就像汽车有基础款和高端款。但关键要认识到,机器人不是单纯的消费品,它是生产力工具。长远看,当机器人推动生产力爆发式增长后,其成本也会随之下降,从而让普及成为可能。
Q:进家后,哪些是需求最高的场景?有量化数据吗?
王昊:家庭场景最特别的一点是,任务无法在进门前列。从进门那一刻起,机器人就需要开始自主规划和拆解任务。这种环境的自然复杂性,恰恰是最高质量的数据来源。
王潜:我们不希望给机器人设限。你可以从功能上分类,如清洁、烹饪、看护,但本质上,我们追求的是一个能平等处理所有任务的通用智能体。这正是我们走向AGI(通用人工智能)的核心逻辑。
Q:机器人如何实现“边干边学”?迭代周期是固定的吗?
王潜:我们的模式是,机器人在执行任务的同时就在进行数据回流和在线学习。因此,没有固定的“迭代周期”这个概念,它是一个持续进化的过程。

谈原生模型:“主流做法都有局限,我们走的是第三条路”
Q:自变量在数据采集上采用了仿真、真机、可穿戴设备等多种方式,整体规划是怎样的?
王昊:核心原则是数据必须来自现实。获取途径多样:纯视频、可穿戴设备、机器人本体操作、以及最高阶的交互式探索数据。从上到下,采集难度递增,但数据价值也往往更高。本质上,训练一个好模型,关键在于找到有效“压缩”数据的方法,这离不开模型与数据闭环的整体策略。
Q:行业有观点认为1万条数据是实现零样本泛化的一个节点。目前数据收集情况如何?进家后数据收集的目标是什么?
王昊:我们不以简单的“条数”来衡量。家庭任务多样,我们的做法是:让经过前期训练的模型先去尝试,它做不好的部分,再通过人机协作来补充。数据价值取决于任务的丰富度、平均长度和复杂性。我们的回流是“在线学习”模式:机器人先做,做不了就协作,数据实时回流,模型即时更新。
Q:如何看待行业内成立数据联盟的趋势?
王潜:我们对合作持开放态度。但行业尚处早期,数据采集的标准和意义对每家公司可能不同。我们对数据质量要求较高,在数据闭环的哲学和运营方式上有自己的坚持,因此倾向于建设自有数据体系。
Q:之前开源模型解决了灾难性遗忘问题,今天你们也强调了减少数据损耗。这些做法的初衷是什么?
王潜:最关键的方法论是“减少人为干预”。历史证明,干预越少,模型表现越好。从分层模型到端到端,核心趋势就是走向一个完全统一的大模型架构。当前主流做法是继承已有的VLM或视频生成模型,但我们认为这两种方式都有问题,因为它们并非为物理交互而生。因此,我们选择了第三条路:从头训练一个世界统一模型。
王昊:从资源角度看,2023年做端到端模型时数据稀缺,所以需要继承预训练模型。如今我们的数据规模已足以支持从头训练原生模型,不再受历史架构限制。
Q:实现如此强的进家泛化能力,技术架构上最大的更新是什么?
王昊:最核心的驱动力还是数据。当数据的规模和质量突破某个临界点,零样本泛化会自然出现。推动机器人进家,既是满足公众需求,也是我们商业和技术探索的必然选择。
Q:除了数据,解决泛化能力还有哪些难点?
王潜:模型架构本身至关重要。必须做原生模型,才能捕捉物理世界的复杂规律。继承现有模型,会在语义和物理规律理解上存在缺陷。物理世界的复杂性是独特的——为什么马拉松机器人挑战小?因为它主要对抗恒定的重力场,脚踩歪一点影响不大。但我们的操作,手歪0.1毫米,整个任务就可能失败。
王昊:物理世界模型的挑战是独特的,需要处理动态视觉、2D到3D的推理,以及交互中复杂的随机性,这些在数字模型中从未遇到过。
Q:如何看待行业当前泛化性水平?后续有何规划?
王昊:现阶段,如果期望不高,机器人会带来惊喜;若以人类标准衡量,则会失望。我们的泛化性体现在,同类任务在不同家庭环境中都能应对。行业整体都已观察到零样本泛化现象,只是程度不同。这个领域的发展速度,可能比直觉更快。
王潜:真正意义上的大泛化突破,可能就在不远的将来。
Q:自有数据采集工厂的建设进度和资本开支情况如何?
王潜:我们的自建工厂从2024年初启动,完全使用自有资金,目前已是国内乃至全球规模最大的之一。这确实是资本开支的重要部分。
Q:自有数据与外部数据的配比如何?不同类型数据对泛化的作用有何不同?
王潜:我们平等对待所有来源的数据,不会预设固定配比。
王昊:当你开始精细调配比时,说明数据已相对充裕。不同类型数据的价值取决于其物理信息密度。纯视频数据易采集但密度低;高密度的本体数据难采集、比例小。我们的原则是减少人为干预,让模型自己去挖掘不同数据源的信息。

谈行业竞争:“技术壁垒够高,领先窗口期还有三年”
Q:机器人马拉松显示硬件门槛在降低,大厂系统能力强。在“大脑”能力缺乏外显标准的情况下,如何保证领先性?窗口期有多久?
王潜:首先,马拉松和我们完全是两个领域。我们的领先性在于数据和软硬一体能力。建立一个从数据收集、清洗、训练到评测的完整工程体系,是最难的部分,构成了长期竞争力。参考OpenAI领先Google约两年,我认为在机器人领域,这个窗口期会更长,可能超过三年。
Q:具身智能赛道的真正壁垒是什么?哪些是阶段性领先,哪些是持久门槛?
王潜:跑马拉松主要是硬件的事,而硬件在中国没有持久壁垒。我们做的是基础模型,壁垒高得多。机器人是硬件、软件、智能、产品和生活方式的完整集成,其技术壁垒可能长达三年甚至更久。这是一个系统性的壁垒。
Q:如何看待大厂全面进入带来的竞争?
王潜:我们身后站着几乎所有布局AI的大厂,他们同时也是我们的投资者。这恰恰说明了创业公司的独特价值。市场足够大,创业公司在软硬一体能力和技术深度上具有优势。资源不构成绝对壁垒,技术才是。在大模型时代,大家可能因为“知识蒸馏”的普遍存在而觉得技术门槛变低了,但机器人领域无法简单蒸馏,技术壁垒会体现得更明显。
Q:自变量获得了四家大厂的投资,打动他们的核心是什么?
王潜:当前,所有物体的制造都无法完全脱离人力,“机器制造机器”仍需要人参与,导致生产力发展是线性的而非指数的。当具身智能成熟时,生产力有望迎来指数级爆发。目前整个行业的资本热度其实是偏冷的。我们的股东是全球AI领域最具判断力的公司,他们看中的正是我们的技术领先性,并且对我们没有短期回报要求。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
预计算力需求持续旺盛行业景气度维持高位
近日,上海在数字经济战略布局上再出关键举措。市政府办公厅正式印发《国家数字经济创新发展试验区(上海)实施方案》,其中对算力资源的规划部署成为业界关注焦点。方案明确提出,要加快推进算力资源的高效互联与协同调度。具体而言,将进一步提升上海市算力监测调度平台与长三角(上海)算力互联互通平台的核心功能,积极
千问AI一键生成PPT 三分钟完成内容排版
近日,千问AI的PPT生成功能迎来了一次架构层面的重大升级,全面转向全新的智能体驱动模式。官方数据显示,升级后的系统能在1至3分钟内,自动完成从主题分析、内容规划、素材搜集到版式设计的全流程工作。这一效率的飞跃,迅速在教育工作者及办公用户群体中引发了广泛的试用与热议。 具体而言,用户现在只需输入简单
上交大与vivo团队在CVPR 2026提出扩散模型高效优化新方法
许多用户初次接触图像生成模型时,常被其快速生成“像模像样”图片的能力所惊艳。然而,当真正将其投入高频生产工作流时,另一层面的挑战便逐渐浮现。 例如,在创作活动主视觉时,模型生成的前几稿可能在主体、色调与氛围上都符合预期,但一旦放大审视细节,手部结构、材质纹理或元素间的边缘关系往往经不起推敲。又如,为
支付宝AI付龙虾插件更新日志与安装升级指南
当你在对接支付宝AI付功能,使用OpenClaw(常被开发者称为“龙虾”)插件时,如果突然遇到功能异常、支付回调失败,或者系统无法识别最新的交易字段,这很可能不是你的业务逻辑出了问题,而是插件版本滞后了。技术栈的兼容性就像齿轮,一个齿对不上,整个传动就可能卡住。别担心,升级插件通常就能解决。下面这几
支付宝AI付在龙虾OpenClaw上的测试与支付成功确认指南
为OpenClaw(龙虾)成功接入支付宝AI付功能后,如何全面验证支付链路是否真正畅通无阻?关键在于模拟一次真实的用户支付行为,并严格确认从指令识别、订单生成、授权跳转、支付执行到状态记录的五个核心环节全部正常运转。以下这套详细的测试流程,将帮助你系统性地完成功能验证,确保支付体验流畅可靠。 一、发
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

