当前位置: 首页
AI
清华数学大神跳槽OpenAI!主导SAM与Llama开发实战揭秘

清华数学大神跳槽OpenAI!主导SAM与Llama开发实战揭秘

热心网友 时间:2026-02-25
转载

henry 发自 凹非寺
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

又一位清华大神加入OpenAI!

刚刚,毕业清华大学数学系,曾在Meta FAIR工作3.75年、主导过SAMLlama多项核心工作的研究员张鹏川(Pengchuan Zhang)宣布离职。

他的下一站,是来到OpenAI,投身于世界模拟与机器人学(World Simulation and Robotics)方向的研究。

他在推特中写道,自己非常期待探索视觉感知、世界模型与机器人技术如何融合,构建真正的“物理智能”。



OpenAI世界模拟方向的负责人之一、Sora项目资深领导Aditya Ramesh也第一时间留言欢迎。



从视觉理解到底层世界模型,这一步转向本身就很有意味。



那么,这位曾站在SAM与Llama核心位置的研究员,究竟是谁?

张鹏川是谁?

2007年,张鹏川从重庆市南开中学高中毕业,考进清华大学,主修数学。



本科毕业后,他前往美国加州理工学院(Caltech)攻读博士,于2017年获得应用与计算数学博士学位。

博士期间,他专注于机器学习理论与应用,开始探索深度学习在视觉领域的潜力。



博士毕业后,他加入微软研究院,并在Microsoft Research雷德蒙德担任首席研究员。



期间,他领导了雷德蒙德实验室的计算机视觉与多模态智能研究工作。

同时还在微软内部跨组织推动计算机视觉与多模态智能项目,包括Alexandar Multi-Modal和Florence等方向。

值得一提的是,他在2024年还加入了华盛顿大学,担任电气与计算机工程系的兼职助理教授至今。



2024年起,他转入Meta FAIR(现Meta超级智能实验室),研究计算机视觉与多模态智能,累计工作近4年。

在此期间,他主导多项开创性项目,包括:

担任Segment Anything 3(SAM 3)项目负责人:SAM 3是一个统一框架,可在图像和视频中实现目标检测、分割与跟踪。

作为SAM系列最新迭代(2025年11月),该模型推出统一框架,支持图像和视频中的目标检测、分割与跟踪,实现零样本泛化到任意物体和场景。



担任Llama 3视觉 grounding项目负责人,主导输入侧视觉 grounding能力建设,使Llama 3成为首个在Visual Commonsense Reasoning(视觉常识推理)基准上达到人类水平的开源模型。

担任Llama 4视觉grounding项目负责人,延续Llama 3优势,进一步强化专家级图像grounding能力(如像素级定位与复杂场景理解),被视为Llama 4对标GPT-4o的关键差异化亮点。

这些工作不仅提升了Meta的生成式AI竞争力,还为开源社区贡献了高影响力工具。

截至目前,张鹏川谷歌学术被引高达34659次!



One more thing

在张鹏川的推特下方,一位网友忍不住发问:

为什么突然之间所有人都在加入 OpenAI?我是挺兴奋的,但这是为什么?



这个疑问,其实并不突兀。

自2025年底以来,已经有多位业内知名人物陆续加入 OpenAI——

括姚班大神陈立杰,Roblox高管Arvind KC,《性能之巅》作者Brendan Gregg,以及从Thinking Machines Lab回流的Barret ZophLuke MetzSam Schoenholz等人。

与此同时,前段时间刷屏的xAI离职潮,也让不少人猜测——

OpenAI会不会成为这些顶尖研究者的下一站?

对此,评论区有位网友回复得很直接:

因为(OpenAI)有算力+Sora级别的世界建模基础设施。如果没有这两样,到2026年几乎不可能做出真正高水平的机器人系统。



如果这条判断成立,那么张鹏川的选择,或许不只是一次个人职业转向。

也是OpenAI今年对“世界模型 + 物理智能”路线的下注。

让我们期待鹏川在OpenAI的工作!

[1]https://pzzhang.github.io/pzzhang/

[2]https://scholar.google.com/citations?hl=zh-CN&user=3VZ_E64AAAAJ&view_op=list_works

[3]https://x.com/PengchuanZ/status/2026189659228012558?s=20

来源:https://www.163.com/dy/article/KMK73S550511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
前Meta总监田渊栋创业获谷歌英伟达投资研发自我进化AI

前Meta总监田渊栋创业获谷歌英伟达投资研发自我进化AI

前Meta FAIR研究科学家总监田渊栋近日在社交平台X上正式宣布,其创立的新公司Recursive_SI已正式亮相。这家聚焦递归超级智能的初创企业,自成立之初便备受业界瞩目。 Recursive_SI的起步堪称梦幻。公司成立仅数月,在产品尚未正式发布的情况下,便已完成超过6 5亿美元的巨额融资,估

时间:2026-05-14 17:39
Joby与Skyports合作完成纽约首批eVTOL点对点飞行

Joby与Skyports合作完成纽约首批eVTOL点对点飞行

纽约的天空,正迎来一场静悄悄的变革。就在不久前,垂直起降机场开发与运营公司Skyports Infrastructure与Joby A viation合作,在“2026电动天空之旅”纽约市飞行活动期间,完成了一系列具有里程碑意义的飞行。活动从4月23日持续至5月1日,多架次点对点的电动垂直起降(eV

时间:2026-05-14 17:38
索尼PlayStation利用AI技术革新游戏开发流程

索尼PlayStation利用AI技术革新游戏开发流程

索尼将AI定位为游戏开发的效率工具,旨在辅助而非取代人类创意。其AI工具可自动生成面部动画,大幅缩短制作时间,已应用于《地平线》等游戏。索尼强调创意核心始终在人,AI主要用于自动化重复流程、加速建模测试。公司亦探索生成式AI在视频制作中的应用,同时承认该技术在一致性与可控性上仍。

时间:2026-05-14 17:38
穆巴达拉携手Core42与Solutions+共建主权AI基础设施

穆巴达拉携手Core42与Solutions+共建主权AI基础设施

Core42与Solutions+达成战略合作,共同推进阿联酋主权AI基础设施建设。Core42提供主权云与AI算力,Solutions+负责实施与数据服务,双方构建端到端交付模式,服务于穆巴达拉集团及政府机构,确保数据驻留境内,支撑国家数字化战略与经济韧性。

时间:2026-05-14 17:37
Yum Brands技术负责人详解如何构建餐饮业AI骨干平台

Yum Brands技术负责人详解如何构建餐饮业AI骨干平台

编者按:本文内容源自CIO Dive与CX Dive于今年5月举办的线上研讨会,相关精彩内容现已开放按需回看。 谈及餐饮巨头与科技的深度融合,Yum Brands(百胜餐饮集团)无疑是行业先行者。早在三十二年前,其旗下品牌必胜客便通过PizzaNet平台,成功完成了全球首笔餐厅在线订单交易,开创了餐

时间:2026-05-14 17:36
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程