腾讯AI大模型“变阵”:成立Infra部门,姚星出任首席科学家
AI新浪潮观察
5min read
腾讯大模型「变阵」:成立 AI Infra 部,姚顺雨出任首席 AI 科学家
连然2025/12/17

摘要
在混元 2.0 发布两周后,腾讯大模型研发体系完成了一次关键的「系统升级」。
头图来源:视觉中国
大模型战事进入深水区,腾讯正在通过调整阵型,来适应更快的速度。
12 月 17 日,腾讯宣布升级大模型研发架构。这次调整最核心的变化在于成立了三个新部门:AI Infra 部、AI Data 部、数据计算平台部 。
这是腾讯在混元大模型步入 2.0 时代后,对研发体系的一次全面「提速」。
在人事任命上,技术派高管被推向了更核心的位置。Vincesyao 出任「CEO/总裁办公室」首席 AI 科学家,直接向腾讯总裁刘炽平汇报;同时,他还兼任新成立的 AI Infra 部及大语言模型部负责人,向技术工程事业群(TEG)总裁卢山汇报。
一手抓算法(大语言模型部),一手抓算力基建(AI Infra 部),同时直通公司最高决策层,这一配置表明:在腾讯的战略棋盘中,大模型的研究与工程落地正在完成深度耦合。
姚顺雨,98年的AI顶尖青年科学家
据了解,Vinces Yao就是数月前传闻入职腾讯的姚顺雨,毕业于清华和普林斯顿大学,曾任OpenAI研究员。
据外媒报道,自今年 9 月从 OpenAI 离职加入腾讯以来,姚顺雨被高层赋予了极大的权限,以推动内部的文化与组织变革。过去几个月里,腾讯一改往日在大模型人才战中的守势,开始以双倍薪资激进地从字节跳动等竞争对手处挖角核心研究员,并为应届博士生开出高出行业标准 50% 的薪资溢价。

姚顺雨10月在X上发帖|图片来源:X
更深层的变化在于「权力交接」。腾讯正在进行内部重组,降级那些虽擅长工程落地和广告算法、但缺乏前沿 AI 研究背景的管理者,将指挥棒真正交还给「研究派」。这种去肥增瘦的动作,旨在打破过去「产品经理思维」主导大模型研发的局限。
姚顺雨出生于1998年,是人工智能领域的顶尖青年科学家,本科毕业于清华大学计算机系(姚班),后赴普林斯顿大学攻读计算机科学博士学位,2024年正式加入 OpenAI,专注于智能体(Agents)与深度研究(Deep Research)方向。
他在OpenAI任职及相关研究期间,主要在大模型推理、Agent(智能体)——及评估体系方面取得了核心成果:
提升推理能力:提出了著名的思维树(Tree of Thoughts, ToT),通过让大模型进行多路径推理和反复思考,大幅提升了模型解决复杂问题的能力;
智能体研究:他是 SWE-bench(大模型代码能力评估数据集)和 SWE-agent(开源AI智能体)的关键贡献者,并参与了 ReAct(推理与行动结合)和 CoALA(智能体认知架构)等开创性工作。
此外,他还在个人社交平台发布了关于“AI 下半场”的思考,主张AI发展的重心应从单纯的训练转向定义问题与评估,提出要像产品经理一样思考“解决什么问题”,认为在当前阶段评估比训练更为重要。
为什么是 AI Infra?
在过去一年的「百模大战」中,行业逐渐达成一个共识:大模型的竞争,早已超越了单纯的算法层面,变成了算力、数据、工程化能力的综合比拼。
此次腾讯成立 AI Infra 部,也是为了解决「算力效率」这一关键命题。
据最新信息,AI Infra 部将作为腾讯大模型体系的重要一环,聚焦于大模型分布式训练、高性能推理服务等核心技术。其目标非常明确:构建大模型 AI Infra 的核心竞争力,为算法研发和业务场景落地提供稳定、高效的技术底座。
这符合大模型技术演进的规律——当模型参数量级不断跃升(如腾讯近期发布的混元 2.0),如何让庞大的 GPU 集群高效运转,如何在大规模并发下保证推理速度和成本,已经成为决定生死的「隐形战场」。
腾讯方面表示,在过往混元大模型的训练及海量业务实践中,腾讯已积累了系统化的工程能力。此次独立建制,意在进一步强化这一优势,提升 AI 大模型的整体研发效率。
除了算力基建,数据质量和评测体系也被提到了新的高度。
此次升级中,新成立的 AI Data 部 将由刘煜宏负责,专注于大模型数据及评测体系建设;而数据计算平台部则由陈鹏负责,聚焦大数据和机器学习的数据智能融合平台建设。两人均向公司副总裁蒋杰汇报。
这意味着,数据处理不再只是算法研发中的附属流程,而是作为独立且关键的环节被标准化和制度化。
与此同时,王迪将继续担任大语言模型部副总经理,向姚顺雨汇报,确保模型算法团队与新成立的基础设施部门保持紧密协同。
效率变革,从代码到产品的「AI 化」
过去两年,尽管拥有微信这样的国民级应用,腾讯在 AI 模型层却一度被外界视为「旁观者」。
一个标志性事件是,今年 2 月腾讯元宝率先接入 DeepSeek R1。虽然这一动作让元宝的活跃用户数实现了数量级跃升,但也给腾讯内部敲响了警钟:自有模型的缺位,甚至导致内部部分业务团队因混元竞争力不足而犹豫是否接入。
这种焦虑最终转化为自上而下的压力。据报道,腾讯总裁刘炽平今年早些时候曾对团队下达硬指标,要求必须在技术水位上赶超对手。此次变革,正是为了解决此前因组织分散导致的资源内耗,集中力量为算法团队输送「弹药」。
架构调整的最终目的,是为了支撑产品和业务的快速奔跑。
在前不久的 12 月 5 日,腾讯发布了混元 2.0,在预训练数据和强化学习策略上进行了显著改进,其 3D 模型甚至保持着全球领先水准,在开源社区下载量突破 300 万。
在应用层,腾讯元宝上线初期保持了「一天一版本」的迭代频率,目前用户规模已稳居国内 AI 应用前三。而在腾讯内部,一场静水流深的 AI 效率变革正在发生:超过 90% 的腾讯工程师正在使用腾讯云代码助手 CodeBuddy;50% 的新增代码由 AI 辅助生成;代码评审环节的 AI 参与度高达 94% 。
目前,腾讯混元大模型已在腾讯会议、微信、广告、游戏等内部超过 900 款应用和场景中落地。
近期混元团队的高密度人才引进与重组,本质上正是为了支撑这种高强度的技术攻坚与业务渗透 。通过成立 AI Infra 等新部门,腾讯正在试图打通从底层算力、数据处理到上层算法、应用落地的任督二脉,为接下来的 AI 长期竞赛备好粮草。
腾讯大模型混元
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
微软AI新任CEO Mustafa Suleyman:DeepMind联创引领未来
DeepMind与Inflection联合创始人MustafaSuleyman加入微软,领导新成立的MicrosoftAI部门,其同事KarénSimonyan也将一同加入。Inflection作为明星AI初创公司,此前获微软领投,核心团队被整体挖走凸显了AI顶尖人才争夺的白热化。Mustafa职业生涯经历丰富,曾共同创立DeepMind并引发行业关注,其管
2026全球开发者先锋大会上海开幕倒计时5天
2024全球开发者先锋大会3月23日至24日在上海举行,主题为“模速空间”。大会涵盖前沿技术讲坛、互动体验及人才活动,汇聚国内外顶尖社区与投资机构,发布众多技术岗位。现场设沉浸式科技体验区,举办多场工作坊与竞赛,旨在促进开源协作与技术融合,为开发者提供交流与机遇平台。
专访方昱春教授:数据驱动的手语识别研究如何突破数据瓶颈
上海大学方昱春教授团队专注于数据驱动的手语识别研究,结合计算机视觉与深度学习技术,在多模态数据采集、孤立词与连续手语识别等方向展开工作,并探索与自然语言处理的融合。研究旨在为聋人群体提供应急、医疗等场景的数字支持,同时关注手语在认知机制研究中的价值。团队通。
对话孙宇教授解析大语言模型在机器人任务规划中的应用
大语言模型为机器人任务规划提供了新工具。研究将其创造性与知识网络的可靠性结合,通过生成多任务树、合并筛选,形成高效准确规划,能将高级指令转换为可执行动作,甚至融合步骤创新流程。两者优势互补,在开放创新的同时确保正确性,具备良好泛化能力。未来需关注自主纠错与环境。
国产3D视觉技术如何革新新能源汽车产业
国产3D视觉企业正迎来切入汽车制造领域的机遇。过去行业保守依赖外资,如今随新能源汽车产业崛起及国产技术成熟,凭借性价比与本土化服务优势,国产设备开始进入主流供应链。当前竞争加剧,企业需在细分领域错位发展。长远看,智能化需求广阔,但国产替代的核心仍是提升技术硬实力。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

