机器人通用大脑如何实现这家公司给出创新方案
“让计算机在智力测试或下棋时表现出乘人水平相对容易,但要让它们在感知和行动方面拥有1岁儿童的技能,却很困难甚至不可能。”1988年,机器人研究员汉斯·马鲁韦克(Hans Mora vec)提出了这个后来被称为“莫拉维克悖论”的观察。近四十年过去了,这依然是横亘在机器人技术面前的最大障碍。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
然而,一家位于旧金山的初创公司——Physical Intelligence(物理智能),正试图彻底解决这个问题。他们的野心是打造世界上第一个通用的“机器人大脑”,一个能够适应现实世界各种混乱场景的基础模型。这家由来自澳大利亚的洛基·格林(Loki Green)联合创立的公司,已筹集超过10亿美元资金,估值达到56亿美元。

我们走进了他们的实验室,亲眼见证了他们的工作,并与创始团队和投资人进行了一场深度对话。
一、从咖啡机到叠衣服:机器人正在学会“动手”
走进Physical Intelligence的办公室,首先迎接访客的是一台全自动咖啡制作机器人。它流畅地拿起手柄、放入咖啡机、按下按钮,整个过程一气呵成。“这是我喝过最好喝的机器人咖啡。”采访者半开玩笑地评价道。
但这仅仅是冰山一角。旁边,一台机械臂正在处理一件从未见过的短裤,试图将其折叠整齐。通过观察和大量的遥操作数据,机器人学会了如何处理这类可变形物体——这在过去几乎是机器人不可能完成的任务。“我叠衣服叠得特别差,”公司联合创始人洛克·格林坦言,“所以看到机器人能帮我做这件事,真的很有帮助。”
团队还展示了削水果皮、组装包装等其他任务。这些在人类看来简单的家务活,对机器人而言却是巨大的挑战,因为它们涉及对可变形物体的精细操控、复杂的物理交互以及对混乱环境的实时适应。
二、为什么机器人技术过去几十年一直“掉链子”?
在采访中,洛克解释了机器人技术长期未能走出工厂、进入日常生活的根本原因。“之前的机器人几乎完全是预先设定好的,”他分析道,“你把它们部署到流水线上,它在同一个位置拾取同一个零件,以同样的方式操作,周而复始。这没问题,但它是完全确定性的。”

后来出现的机器人引入了计算机视觉,但仍然是针对特定场景的高度定制化方案。核心瓶颈在于,它们无法处理“变异性”。现实世界是混乱且不可预测的:厨房里的光线、桌上物体的位置、衣物的褶皱状态……每一秒都可能不同。
“对计算机来说容易的事(比如算术、下棋),对人类很难;对人类来说微不足道的事(比如走路、抓取、叠衣服),对计算机却极其困难。”洛克将这种能力的缺失称为“物理智能”的空白,而这正是他的公司立志要填补的领域。
三、数据、算法、部署:Physical Intelligence的研发引擎
那么,他们打算如何攻克这一难题?洛克给出的方法论与其他深度学习领域相似,但执行层面更为复杂:“收集海量数据,重新设计并编写能够从这些数据中学习和拟合的算法,然后逐步完成部署。”
在公司开放式的办公空间里,景象颇具未来感:一边是研究人员在激烈讨论算法架构,另一边则是数据收集员正通过“遥操作”界面,控制机械臂演示各种家务任务。这些收集来的动作数据会被仔细标注、混合、增强,然后用于训练模型,最终再回到同一台机器人上进行效果评估。
“我们拥有一个庞大的研究团队,”洛克介绍道,“他们提出假设,这些假设通常需要收集特定量的数据来验证。接着我们训练模型,并在收集数据的那些实体站点上评估模型性能。通过结果,我们能清晰地判断这个研究想法是否有效——可能是一种新算法,一种新的数据收集策略,或者一种新的数据混合方式。”
四、从洗衣到泛化:三个版本,三次突破
Physical Intelligence的技术演进路径清晰可见。他们的首个版本(代号Pi-0)专注于功能证明——让机器人做到以前不可能的事情,例如折叠衣物。选择这个任务不仅因为其物理复杂性,更因为“人人都知道怎么叠衣服”,数据收集的门槛相对较低,是理想的试验平台。
第二个版本(Pi-0.5)则转向泛化能力的验证。团队证明,机器人只需在大约100个不同的家庭环境中进行训练,就能将学到的技能推广到第101个从未见过的家庭中。这个结果出乎意料,他们原本预估可能需要成千上万甚至上百万个样本才能达到类似效果。
最新的版本重点攻坚性能。团队正在开发能让机器人自主提升任务成功率的方法,目标是在洗衣、制作咖啡、组装包装等任务上达到极高的可靠度。“这是一个以前从未实现过的水平,”洛克指出,“但要大规模部署机器人,它们需要表现得极其出色,而这一点一直难以捉摸。我们还没有完全解决这个问题,甚至不能说已经接近。”

五、投资人视角:时机、团队和超预期的速度
菲利普·克拉克(Philip Clark),Thrive Capital的投资合伙人,是Physical Intelligence最早的投资人之一,从公司只有四人在客厅创业时便已介入。“所有伟大的公司投资最终都归结为两件事:人和时机,”菲利普总结道,“很明显,这些人是世界上最优秀的科研人员在攻克这个问题。而时机也恰到好处——如果回到十年前,底层的大模型能力根本还不具备。”
他透露,Physical Intelligence的进展速度比他最乐观的预期还要快两到三倍。“我原以为可能需要三到五年才能达到现在的水平,但他们只用了一年半。”菲利普特别提到了洛克·格林的背景:这位来自珀斯的澳大利亚人,17岁便飞赴硅谷,加入Stripe成为早期员工,在那里展现了非凡的职业道德。之后他一直投资并关注机器人领域,直到2023年,他听说DeepMind机器人团队的几位顶尖科学家(包括卡尔·豪斯曼、谢尔盖·莱文、切尔西·芬恩)打算离开,于是果断联手创办了Physical Intelligence。
六、未来十年:机器人做无聊、危险、无意义的工作
当被问及“如果成功,十年后世界会是什么样”时,洛克沉思了片刻。“世界将会变得非常不同,简直难以想象,”他说,“但我认为这会是一个更好的世界。”
他强调,许多人一生中花费大量时间从事的并非令人愉悦的工作——洗衣服、打扫房间、重复性的工厂劳动。“他们这样做并非出于自愿,而是迫不得已。为了让社会正常运转,有大量必须完成的事情,而人们从中获得的乐趣或意义寥寥无几。”
“人们从工作中获得意义,但我认为未来的工作不必和过去一样。我们的成功,很大程度上将取决于能否改变那些枯燥、危险、无趣、毫无意义的工作——那些本应由机器人来完成的工作。而人们真正想做的事情,他们应该被解放出来去做。这就是我做这一切的真正希望。当然,在这两者之间会有许多困难和复杂的情况需要应对,但我对人性充满信心和乐观。”
七、展望:GPT-2时刻已经到来?
洛克将目前机器人技术的发展阶段,比作大语言模型的早期。“这更像是GPT-2的时刻,而不是GPT-3、GPT-4的时刻。我们看到了‘生命’的迹象,看到了潜力,但还需要巨大的努力去扩大规模,才能让它真正变得实用,对世界各地的每个人都有用。”
对于接下来的一到三年,他持谨慎乐观态度:“很难想象在未来几年内,实用性强的机器人就会进入千家万户。有些事情需要一定的‘智力’,以及应对变化的能力——哪怕只是洗碗或叠衣服。我们正走在解决问题的路上,但企业级的产品似乎触手可及,消费级领域也将迎来新一波浪潮。”
八、独特的文化:研究+工程,寻求真相
Physical Intelligence的团队文化给采访者留下了深刻印象。这里融合了顶尖的学术研究人员和来自Stripe等公司、注重实战的工程师。“我没想到这家公司会是这样,”采访者感叹,“我以为会有很多刻板印象,但这里的研究人员和工程师与最终目标有着出奇紧密的联系。有一种对最终目标的执念,以及尽快达成目标的执念。”
洛克将这种文化归结为“一种探寻真相的渴望,一种雄心壮志”。最优秀的研究人员所具备的好奇心、创造力和开放心态,在这里得到了充分的尊重和发挥。

从折叠衣物到制作咖啡,从实验室的数据收集到未来真实的场景部署——Physical Intelligence正站在机器人技术的一个历史性转折点上。他们相信,通用的“机器人大脑”不再是科幻小说的专属,而是即将到来的现实。而这场变革的终极目标,始终清晰:将人类从无意义的体力劳动中解放出来,让人们得以投身于真正热爱、并能创造价值的事业中去。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
妙鸭相机团队去年解散 虎鲸文娱回应传闻
据可靠消息,虎鲸文娱旗下AI产品妙鸭相机的核心团队已于2025年9月底解散,产品进入静默状态。该应用曾凭借数字分身写真功能迅速走红,但负责人张月光在2024年11月因方向分歧离职创业。其新公司沐言智语发展迅速,已获高额融资并推出新产品。
实在智能RPA AI 轻代码自动化流程实现指南
在数字化转型的浪潮中,企业寻求更高效、更智能的流程优化方案已成为必然。当机器人流程自动化(RPA)与人工智能(AI)深度融合,一场深刻的效率革命正在上演。而“低代码”或“轻代码”理念的兴起,无疑为这场变革按下了加速键,显著降低了流程自动化的技术门槛,并极大地拓宽了其应用场景。 传统的RPA实施,往往
大语言模型应用场景与未来发展趋势解析
在信息爆炸的今天,大语言模型作为人工智能技术的杰出代表,已深度渗透并改变着我们的日常生活与工作方式。它不再仅仅是前沿科技的象征,更成为了提升沟通效率、优化信息处理体验的强大工具。 自然语言处理的领航者 大语言模型的核心优势,首先体现在自然语言处理领域。通过深度学习和海量数据训练,它精准掌握了人类语言
Word文档智能比对RPA工具轻松实现高效操作
在文档管理与合规审核工作中,准确高效地比对两个Word文件的内容一致性,是一项基础且关键的任务。传统的人工逐字核对方法不仅效率低下、耗时费力,还极易因视觉疲劳导致疏漏。如今,借助先进的智能比对技术与自动化工具,这一过程可以变得极为高效和精准。特别是通过引入实在智能的RPA(机器人流程自动化)机器人,
大语言模型核心原理与行业应用全解析
人工智能技术日新月异,大语言模型作为当前AI领域的热点,正在深刻改变我们获取信息、处理知识和进行创作的方式。从ChatGPT到文心一言,国内外各类大语言模型凭借其卓越的自然语言理解能力、流畅的文本生成效果和广泛的应用场景,已成为推动产业智能化升级的核心技术之一。 简单来说,大语言模型是一种基于海量文
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

