当前位置: 首页
AI资讯
腾讯AI重构后姚顺雨首份答卷出炉

腾讯AI重构后姚顺雨首份答卷出炉

热心网友 时间:2026-05-20
转载

腾讯混元大模型家族迎来了一个备受关注的新成员。4月23日,腾讯正式发布并开源了混元Hy3 preview语言模型。这款模型主打快慢思考融合的MoE架构,总参数达2950亿,激活参数为210亿,最大支持256K上下文长度。官方宣称,其整体性能达到了同尺寸模型的最佳水平。

从研发节奏看,Hy3 preview于2026年1月底正式启动训练,从训练到上线用时不到三个月。腾讯内部将其定义为混元大模型从“读万卷书”走向“行万&里路”、尝试解决真实世界复杂问题的开端。

而这款模型最受行业瞩目的标签在于,它是“天才少年”姚顺雨在2025年底加盟腾讯后,全程主导推出的第一代大模型。作为腾讯重金邀请的首席AI科学家,Hy3 preview既是他对重构后混元研发体系的首次完整实践,也承载着腾讯补齐AI短板、在大模型下半场实现追赶的核心期待。

姚顺雨表示,Hy3 preview是混元大模型重建的第一步。团队希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,以提升Hy3正式版的实用性。与此同时,团队也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度协同设计,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。

一、一手实测Hy3 preview

根据官方披露的核心信息,Hy3 preview从研发之初就围绕智能体(Agent)场景做了针对性设计,这也是它与此前混元系列模型最核心的差异。

在启动模型训练前,姚顺雨主导完成了混元预训练和强化学习基础设施的全面重建,同时定下了模型追求实用性的三大核心原则,构成了Hy3 preview的研发底层逻辑:

能力体系化:不推崇“偏科”,因为即便是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同;

评测真实性:主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”;

性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。

官方资料显示,Hy3 preview采用了总参数量2950亿、激活参数仅210亿的MoE架构,同时融合了“快慢思考”机制。210亿的激活参数,为模型高频次、长链路的Agent调用提供了低成本的运行底座;而“快慢思考”的融合设计,天然适配复杂逻辑推理与多步工具调用场景,也就是姚顺雨提出的ReAct(推理-行动)循环。

我们第一时间对Hy3 preview进行了实测。首先尝试了一个覆盖数据抓取、数值计算、可视化生成、文本分析全链路的综合任务:“使用Python抓取过去90天纳斯达克100、伦敦金与沪深300的日线收盘数据。计算它们之间的皮尔逊相关系数,并用D3.js或ECharts生成一个单文件HTML动态热力图。最后,基于数据结果输出一段500字的跨市场资产配置Memo。”

实测过程显示,Hy3 preview在数据获取阶段反复受阻。接口认证失败后,模型接连切换akshare、yfinance等多个数据源,纳斯达克100数据因速率限制缺失而被迫用模拟数据替代,修错重试的循环消耗了大量时间。

在可视化交付上,Hy3 preview最终生成了三资产相关性热力图,但由于部分数据并非真实采样,热力图的准确性与可信度打了折扣。最核心的文本交付物缺失明显——提示词明确要求输出500字跨市场资产配置Memo,但模型只给出了几行Bullet point式的简略配置比例,没有成文的分析段落,任务交付在关键环节出现了缺位。

随后,我们又尝试了另一个长链路Agent测试:启用浏览器模式,在SkillHub平台进行全链路深度抓取,完整理清腾讯文档Skill的Auth认证全流程与数据同步底层机制,最终输出一份标准化的技术原理分析文档。

在这次测试中,Hy3 preview展现了清晰的Agent自治与多步推理(ReAct)过程:先搜索SkillHub整体介绍;发现需要深入,又去精准抓取了Auth认证的开发者文档;接着去查了MCP Server的底层原理;最后才开始动笔写文档。这证明了Hy3 preview作为Agent的路由调度中心,其长链路规划和工具调用很稳定,没有在中途崩溃或陷入死循环,完整走完了“推理-行动-验证-输出”的闭环。

这一表现也与官方披露的产品落地数据形成了呼应:在CodeBuddy、WorkBuddy产品上,Hy3 preview首token延迟降低54%、端到端时长降低47%、任务成功率提升至99.99%+。在实际用户环境中,已稳定驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、工具链编排等多样化办公场景。

从这两组实测可以看出,Hy3 preview呈现出一种典型的“过渡态特征”。一方面,在复杂任务中,它已经具备了较为清晰的Agent执行路径:能够自主拆解问题、规划步骤,并在不同工具之间进行切换,整体链路没有明显中断。这种“从问题到流程”的能力,确实在向真实工作流靠近。

但另一方面,真正决定可用性的“最后一公里”仍然不够稳定——数据获取阶段的反复试错、关键结果的缺失、以及最终交付物的不完整,都说明模型在长链路执行中,仍然存在“做了一半”的问题。

目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、腾讯文档等产品首发上线,同时支持接入OpenClaw、OpenCode等主流开源智能体产品,并已上架腾讯云大模型服务平台TokenHub。价格方面,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。

二、天才少年,和动起来的腾讯

这是备受关注的“天才少年”姚顺雨入职腾讯后主导的第一代大模型。作为2025年底腾讯重磅挖来的首席AI科学家,Hy3 preview是他入职后交出的第一份核心模型答卷,也承载着腾讯补齐AI短板、发力大模型基础研究的期待。

去年9-12月,姚顺雨入职腾讯,出任“CEO/总裁办公室”首席AI科学家,兼任AI Infra部与大语言模型部负责人,直接向总裁刘炽平汇报,全面统筹混元大模型研发工作。12月,腾讯完成组织架构重构,新设AI Infra部、AI Data部、数据计算平台部,姚顺雨全面掌控混元研发体系。上任后,他立即重构了AI Infra团队,搭建起预训练、精调、后训练、推理等完整研发链条,为后续模型研发奠定基础。

今年1月底,马化腾在年会上承认腾讯AI“动作慢了”,刘炽平同步披露混元3.0正在内部测试,计划4月对外推出。同样是在1月底,Hy3 preview正式启动训练,从训练到上线用了不到三个月。

姚顺雨(1998年生)的履历自带“天才少年”标签,但客观来看,他的技术背景与腾讯当时的AI需求高度契合,这也是腾讯重金挖角的核心原因——腾讯此前混元负责人张正友(深耕计算机视觉领域)、蒋杰(侧重大数据方向)均非NLP/LLM原生背景,而姚顺雨是腾讯首位真正意义上的LLM原生技术领导者,其核心履历与研究方向,恰好匹配腾讯混元突破的核心需求。

在学术界,姚顺雨是顶级的语言智能体(Language Agents)研究者,著名的ReAct(推理-行动框架)和Tree of Thoughts(思维树)均出自其手;在OpenAI短暂的一年多里,他也深度参与了Operator、Deep Research等智能体产品研发,深入接触模型预训练与后训练环节,积累了一线工程化经验。

2025年4月,他曾发表文章《The Second Half》,明确提出,AI的竞争正在从“训练更强的模型”转向“定义并评估真实世界任务”,强调评估体系重构,反对盲目堆料模型规模。

这一理念也贯穿了Hy3 preview的研发。Hy3 preview定位为一个总参数量2950亿、激活参数仅210亿的MoE模型。210亿的激活参数意味着模型具备了高频次、长链路Agent调用的低成本底座,同时其内部融合的“快慢思考”机制,天然适合处理复杂的逻辑推理与工具调用(如ReAct循环)。

从前面的实测来看,Hy3 preview更像是一款验证技术方向的原型模型。把视角拉回腾讯自身,这种“未完全成熟”的状态,可能也有其内在合理性。一方面,Hy3 preview从训练到上线不到三个月,本身就是一次快速迭代的技术试水;另一方面,在经历了AI组织架构的全面重构之后,腾讯也需要这样一款模型,去验证新的研发链条是否通顺、锚定的Agent技术路线是否成立。

不过,在国内大模型已经进入贴身肉搏的当下,Hy3 preview的到来,只是腾讯AI补位的开始。无论是MoE架构的工程化优化,还是Agent场景的产业落地深度,国内头部厂商已经跑通了多轮迭代,腾讯想要追上甚至超车,仅凭一次模型更新远远不够。

来源:https://www.geekpark.net/news/363076

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
腾讯AI重构后姚顺雨首份答卷出炉

腾讯AI重构后姚顺雨首份答卷出炉

腾讯混元大模型家族迎来了一个备受关注的新成员。4月23日,腾讯正式发布并开源了混元Hy3 preview语言模型。这款模型主打快慢思考融合的MoE架构,总参数达2950亿,激活参数为210亿,最大支持256K上下文长度。官方宣称,其整体性能达到了同尺寸模型的最佳水平。 从研发节奏看,Hy3 prev

时间:2026-05-20 18:41
英国 AI 大臣自述:工作中为何反而不使用人工智能工具

英国 AI 大臣自述:工作中为何反而不使用人工智能工具

英国负责人工智能事务的最高官员,在工作中反而不使用AI——这听起来像是个颇具讽刺意味的新闻标题,但却是正在发生的现实。 当地时间4月18日,英国科学、创新与技术大臣丽兹·肯德尔在接受BBC采访时透露,她个人更倾向于在私人生活中使用人工智能,而非工作场景。这番表态与她所肩负的职责形成了鲜明对比。就在数

时间:2026-05-20 18:40
Booking.com与OpenAI合作推出中小企业免费ChatGPT培训课程

Booking.com与OpenAI合作推出中小企业免费ChatGPT培训课程

OpenAI与Booking com合作推出免费虚拟研讨会系列,旨在帮助小企业主掌握ChatGPT应用技能。课程内容涵盖提示词基础、自动化工作流构建及营销、客服等具体场景,通过行业实例指导实操。参与者可免费学习,最终获得适用于自身业务的工作流程方案,实现效率提升。

时间:2026-05-20 18:39
平安医疗AI模型获全球最高评分领跑行业

平安医疗AI模型获全球最高评分领跑行业

平安医疗AI全球夺冠:技术如何真正走进诊室? 最近,全球医疗AI领域传来一个重磅消息。在由OpenAI发布的权威评测HealthBench Hard中,中国平安旗下的平安科技,凭借其“医疗大模型3 5”以57 27的高分拔得头筹,成绩超越了Meta、OpenAI等国际巨头。这个结果,无疑给行业投下了

时间:2026-05-20 18:38
灵光App手机体验世界模型沉浸式探索指南

灵光App手机体验世界模型沉浸式探索指南

灵光App正式上线“体验世界模型”功能,首次将前沿技术引入手机。用户上传图片后,几秒内即可生成专属三维世界,并通过虚拟摇杆以第一人称视角沉浸式探索,实现从静态图像到动态交互空间的转化。

时间:2026-05-20 18:37
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程