当前位置: 首页
AI
英伟达Jim Fan年度复盘:Vibe Coding大火,机器人领域如何破局?

英伟达Jim Fan年度复盘:Vibe Coding大火,机器人领域如何破局?

热心网友 时间:2025-12-29
转载

英伟达机器人业务负责人、GEAR实验室联合负责人Jim Fan近期分享了他对当前机器人领域发展的冷静观察。他指出,目前整个机器人行业仍处于相对混乱的阶段,甚至连技术发展的主流方向都尚未明确,存在走偏的可能性。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

知名科技评论人AK近日也在社交媒体上发布推文,其观点引发了行业媒体的广泛讨论。AK认为,像Vibe Coding这类技术的发展速度令人震惊,其进步之快甚至让他本人也感到焦虑。他进一步表示,如果过去一个月没有紧跟技术发展节奏,那么对软件行业的认知可能已经过时了。

展望2025年,机器人领域的发展图景或许会更趋复杂。英伟达机器人业务负责人、GEAR实验室联合负责人Jim Fan再次表达了他的审慎态度。他强调,机器人领域目前仍处于混沌状态,即便是那些看似明确的发展路径,也未必就是正确的方向。

Jim Fan最近分享了他对机器人领域现状的深度思考,这是他基于2025年的行业观察总结出的三点核心教训。

1. 硬件虽领先于软件,但可靠性问题严重拖累迭代速度

我们已经见证了诸如Optimus, e-Atlas, Figure, Neo, G1等机器人所展现出的精湛工程技艺。

然而现状是,机器人“身体”的物理能力已经超越了其“大脑”的指挥能力。我们虽然在应用最顶尖的AI技术,但并未能将这些前沿硬件的全部潜力充分释放出来。

更为现实的是,照料和维护这些机器人往往需要一整支专业的运营团队。

机器人不像人类,无法在磕碰损伤后自我愈合。过热、电机损坏、离奇的固件问题等故障每天都在困扰着我们。这些错误通常是不可逆的,也是不可原谅的。

Jim Fan不禁感叹:在此过程中,唯一能随着规模增长而同步增加的,恐怕只有研发人员的耐心了。

2. 评测基准(Benchmark)在机器人领域仍是一场灾难

在大型语言模型(LLM)领域,普通从业者通常认为MMLU和SWE-Bench等评测标准是常识。但到了机器人领域?先别急着下结论。

在这里,业界几乎没有对任何事项达成普遍共识:无论是硬件平台的选择、任务本身的定义、评分标准的确立、所使用的仿真器,还是现实世界测试环境的搭建。

每个人都倾向于为每一个新发布的成果临时定义一个基准测试,然后宣称自己达到了SOTA(当前最佳水平)。这就像是从一百次重复试验中,精心挑选出看起来最漂亮的那一次演示。

Jim Fan呼吁:到2026年,我们必须做得更好,停止将科学研究的可复现性和严谨纪律视为次要因素。

3. 基于视觉语言模型(VLM)的VLA路线“感觉不对”

VLA(视觉-语言-动作)模型长期以来一直是构建机器人“大脑”的主流方法。其配方看似简单:取一个预训练好的VLM(视觉语言模型)作为核心,再在上面嫁接一个动作输出模块。

但仔细想想,VLM主要是为应对“视觉问答”这类评测任务而高度优化的模型。

这便引出了两个关键问题:

1. VLM中的绝大多数参数是为服务于语言和知识理解而设,而非为物理世界交互服务的;2. 视觉编码器为了进行高层语义理解(如问答),会主动调整并丢弃大量底层图像细节。

然而对于需要灵巧操作的机器人来说,这些微小的视觉细节恰恰至关重要。

Jim Fan认为,没有理由相信VLA模型的性能会随着VLM参数规模的增加而线性扩展。这种基于VLM的预训练路线可能存在错位。

相比之下,视觉世界模型(Video World Model)似乎是更适合机器人的预训练目标。Jim Fan表示,他个人正将研究重心押注于此。

质疑与回应

针对Jim Fan的这些观点,网友Stewart Alsop提出了尖锐的质疑:

如果视频世界模型是更好的预训练目标,那么为什么像Helix、GR00T N1和π0这些已真正交付成果的模型,依然构建在VLM的骨架之上?

此外,世界模型的方法目前大多只用于策略评估和合成数据,而非直接的运动控制。

另外,既然硬件瓶颈限制了迭代速度,难道这不正说明在解决机器人数据匮乏问题之前,任何预训练路线都面临同样的限制吗?

Jim Fan回应道:

它们都是2025年的模型,我们期待2026年出现下一代更强大的模型。

我个人认为,2026年的行业风向标还要看谷歌。DeepMind显然还在酝酿大招,他们在8月份已经展示过强大的世界模型Genie 3,而Genie 4或许真能让机器人拥有在现实世界连续执行复杂任务的“大脑”。

来源:https://www.51cto.com/article/833020.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
GitLab创始人借力AI抗癌:ChatGPT在现实世界中的真实用途

GitLab创始人借力AI抗癌:ChatGPT在现实世界中的真实用途

Sid 这个案例最震撼我的,不是“AI 参与抗癌”这几个字本身。而是它让我第一次很清楚地感觉到:AI 真正的用途,可能从来都不是回答问题。而是进入那些原本只有专家团队才能推进的复杂现实,把前面的认知

时间:2026-03-31 13:10
Claude已会点外卖!揭秘AI批量替代创业公司的未来危机

Claude已会点外卖!揭秘AI批量替代创业公司的未来危机

说句心里话,我确实不太待见 Anthropic(Claude 背后那家公司),但这并不妨碍它依然是目前全球最顶尖、最牛掰的 AI 公司,没有之一。这个世界就是这么现实:能力强弱和是非对错,那是两码事

时间:2026-03-31 13:04
黄仁勋站台的抱抱脸机器人卖爆了,背后公司竟来自中国

黄仁勋站台的抱抱脸机器人卖爆了,背后公司竟来自中国

henry 发自 凹非寺量子位 | 公众号 QbitAI还记得Hugging Face去年推出的桌面机器人Reachy Mini吗?在刚发布的时候,量子位曾第一时间报道过这只身高28cm、体重1 5

时间:2026-03-31 12:58
上海人工智能实验室发布白皮书:超节点技术赋能智算与AI发展

上海人工智能实验室发布白皮书:超节点技术赋能智算与AI发展

2026年3月29日,由上海人工智能实验室(上海AI实验室)发起并主办的第二届浦江AI学术年会开幕。浦江AI学术年会期间,由上海AI实验室DeepLink团队发布了《超节点技术体系白皮书》(以下简称

时间:2026-03-31 12:53
AI泡沫危机:当前行业过热与未来理性回归分析

AI泡沫危机:当前行业过热与未来理性回归分析

OpenAI此刻正在艰难变现。Sam Altman曾将广告称为最后手段,但ChatGPT如今已开始插入广告;曾被寄予厚望的购物功能宣告失败,Sora视频产品也被关停。故事讲不下去了。 过去24小时,

时间:2026-03-31 12:46
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程