当前位置: 首页
AI
腾讯混元大模型重构完成 Hy3预览版正式上线

腾讯混元大模型重构完成 Hy3预览版正式上线

热心网友 时间:2026-05-18
转载

「Hy3 preview是混元大模型重建的第一步。」

姚顺雨交出了加入腾讯后的第一份模型答卷。

4月23日,腾讯混元Hy3 preview语言模型发布并开源。这款模型主打快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文长度。官方称其整体性能达到了同尺寸模型的最佳水平。

从研发节奏看,Hy3 preview于2026年1月底正式启动训练,从训练到上线用了不到三个月。在腾讯内部,它被定义为混元大模型从“读万卷书”走向“行万&里路”、尝试解决真实世界复杂问题的开端。

而这款模型最受行业关注的核心标签在于,它是“天才少年”姚顺雨在2025年底加盟腾讯后,全程主导推出的第一代大模型。作为腾讯重金邀请的首席AI科学家,Hy3 preview既是他对重构后混元研发体系的首次完整实践,也承载着腾讯补齐AI短板、在大模型下半场实现追赶的核心期待。

姚顺雨表示,“Hy3 preview是混元大模型重建的第一步。我们希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助我们提升Hy3正式版的实用性。与此同时,我们也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,持续提升模型在真实场景中的综合表现,并开始探索特色模型能力。”

一手实测Hy3 preview

从披露的核心信息来看,Hy3 preview从研发之初就围绕智能体(Agent)场景做了针对性设计,这也是它与此前混元系列模型最核心的差异。

在启动模型训练前,姚顺雨主导完成了混元预训练和强化学习基础设施的全面重建,同时定下了模型追求实用性的三大核心原则:

能力体系化:不推崇“偏科”,因为即便是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同;
评测真实性:主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”;
性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。

资料显示,Hy3 preview采用了总参数量295B、激活参数仅21B的MoE架构,同时融合了“快慢思考”机制。21B的激活参数,为模型高频次、长链路的Agent调用提供了低成本的运行底座;而“快慢思考”的融合设计,天然适配复杂逻辑推理与多步工具调用场景,即姚顺雨提出的ReAct(推理-行动)循环。

我们第一时间对Hy3 preview进行了实测。首先是一个覆盖数据抓取、数值计算、可视化生成、文本分析全链路的综合任务:“使用Python抓取过去90天纳斯达克100、伦敦金与沪深300的日线收盘数据。计算它们之间的皮尔逊相关系数,并用D3.js或ECharts生成一个单文件HTML动态热力图。最后,基于数据结果输出一段500字的跨市场资产配置Memo。”

实测过程显示,Hy3 preview在数据获取阶段反复受阻。接口认证失败后,模型接连切换akshare、yfinance等多个数据源,纳斯达克100数据因速率限制缺失而被迫用模拟数据替代,修错重试的循环消耗了大量时间。

在可视化交付上,Hy3 preview最终生成了三资产相关性热力图,但由于部分数据并非真实采样,热力图的准确性与可信度打了折扣。最核心的文本交付物缺失明显——提示词明确要求输出500字跨市场资产配置Memo,模型却只给出了几行Bullet point式的简略配置比例,没有成文的分析段落,任务交付在关键环节出现了缺位。

随后,我们尝试了另一个长链路Agent测试:启用浏览器模式,在SkillHub平台进行全链路深度抓取,完整理清腾讯文档Skill的Auth认证全流程与数据同步底层机制,最终输出一份标准化的技术原理分析文档。

在这次测试中,Hy3 preview展现了清晰的Agent自治与多步推理(ReAct)过程:先搜索SkillHub整体介绍;发现需要深入,又去精准抓取了Auth认证的开发者文档;接着去查了MCP Server的底层原理;最后才开始动笔写文档。这证明了Hy3 preview作为Agent的路由调度中心,其长链路规划和工具调用很稳定,没有在中途崩溃或陷入死循环,完整走完了“推理-行动-验证-输出”的闭环。

这一表现也与披露的产品落地数据形成了呼应:在CodeBuddy、WorkBuddy产品上,Hy3 preview首token延迟降低54%、端到端时长降低47%、任务成功率提升至99.99%+。在实际用户环境中,已稳定驱动最长495步的复杂Agent工作流,覆盖文档处理、数据分析、知识检索、工具链编排等多样化办公场景。

从这两组实测可以看出,Hy3 preview呈现出一种典型的“过渡态特征”。一方面,在复杂任务中,它已经具备了较为清晰的Agent执行路径:能够自主拆解问题、规划步骤,并在不同工具之间进行切换,整体链路没有明显中断。这种“从问题到流程”的能力,确实在向真实工作流靠近。

但另一方面,真正决定可用性的“最后一公里”仍然不够稳定——数据获取阶段的反复试错、关键结果的缺失、以及最终交付物的不完整,都说明模型在长链路执行中,仍然存在“做了一半”的问题。

目前,Hy3 preview已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、腾讯文档等产品首发上线,同时支持接入OpenClaw、OpenCode等主流开源智能体产品,并已上架腾讯云大模型服务平台TokenHub。价格方面,Hy3 preview输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。

天才少年,和动起来的腾讯

这是备受关注的“天才少年”姚顺雨入职腾讯后主导的第一代大模型。作为2025年底腾讯重磅挖来的首席AI科学家,Hy3 preview是他入职后交出的第一份核心模型答卷,也承载着腾讯补齐AI短板、发力大模型基础研究的期待。

去年9-12月,姚顺雨入职腾讯,出任“CEO/总裁办公室”首席AI科学家,兼任AI Infra部与大语言模型部负责人,直接向总裁刘炽平汇报,全面统筹混元大模型研发工作。12月,腾讯完成组织架构重构,新设AI Infra部、AI Data部、数据计算平台部,姚顺雨全面掌控混元研发体系。上任后,他立即重构了AI Infra团队,搭建起预训练、精调、后训练、推理等完整研发链条,为后续模型研发奠定基础。

今年1月底,马化腾在年会上承认腾讯AI“动作慢了”,刘炽平同步披露混元3.0正在内部测试,计划4月对外推出。也是在1月底,Hy3 preview正式启动训练,从训练到上线用了不到三个月。

姚顺雨(1998年生)的履历自带“天才少年”标签,但客观来看,他的技术背景与腾讯当时的AI需求高度契合,这也是腾讯重金挖角的核心原因。腾讯此前混元负责人张正友(深耕计算机视觉领域)、蒋杰(侧重大数据方向)均非NLP/LLM原生背景,而姚顺雨是腾讯首位真正意义上的LLM原生技术领导者,其核心履历与研究方向,恰好匹配腾讯混元突破的核心需求。

在学术界,姚顺雨是顶级的语言智能体(Language Agents)研究者,著名的ReAct(推理-行动框架)和Tree of Thoughts(思维树)均出自其手;在OpenAI短暂的一年多里,他也深度参与了Operator、Deep Research等智能体产品研发,深入接触模型预训练与后训练环节,积累了一线工程化经验。

2025年4月,他曾发表文章《The Second Half》,明确提出,AI的竞争正在从“训练更强的模型”转向“定义并评估真实世界任务”,强调评估体系重构,反对盲目堆料模型规模。这一理念也贯穿了Hy3 preview的研发。

从前面的实测来看,Hy3 preview更像是一款验证技术方向的原型模型。把视角拉回腾讯自身,这种“未完全成熟”的状态,可能也有其内在合理性。一方面,Hy3 preview从训练到上线不到三个月,本身就是一次快速迭代的技术试水;另一方面,在经历了AI组织架构的全面重构之后,腾讯也需要这样一款模型,去验证新的研发链条是否通顺、锚定的Agent技术路线是否成立。

不过,在国内大模型已经进入贴身肉搏的当下,Hy3 preview的到来,只是腾讯AI补位的开始。无论是MoE架构的工程化优化,还是Agent场景的产业落地深度,国内头部厂商已经跑通了多轮迭代,腾讯想要追上甚至超车,仅凭一次模型更新远远不够。

*头图来源:GPT生成

来源:https://www.163.com/dy/article/KR7LI3JB05119FMA.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
通用世界模型问世机器人将具备自主进化与认知能力

通用世界模型问世机器人将具备自主进化与认知能力

33天后,你家或许就要迎来一位不知疲倦的硅基新成员了。 它将面对的是日复一日的家庭琐事:随处散落的衣物、孩子扔在地上的玩具、桌边摇摇欲坠的杯子,或是被猫咪“重新布置”过的客厅……这些看似永远做不完的家务,正是家庭服务机器人需要攻克的核心场景。关键在于,它能24小时在线工作,并且通过持续学习,越干越明

时间:2026-05-18 16:44
腾讯混元大模型正式上线姚顺雨团队主导研发

腾讯混元大模型正式上线姚顺雨团队主导研发

腾讯混元的新一代模型,Hy3 preview,刚刚揭开面纱。 这不仅是混元团队在架构与基础设施层面重新出发后的首个版本,更因其“实用性”的明确标签而备受关注。首批发布的模型尺寸相对较小,目标直指落地应用。同样引人注目的是,这也是AI专家姚顺雨归国加盟腾讯后交出的首份重要答卷,其背后贯彻的正是他所倡导

时间:2026-05-18 16:44
月之暗面Kimi浏览器插件安装与使用指南

月之暗面Kimi浏览器插件安装与使用指南

月之暗面推出KimiWebBridge浏览器扩展,使本地AI助手能直接操作已登录的浏览器。该工具复用用户会话状态,可自动执行网页导航、表单填写及数据抓取等任务,所有处理均在本地完成以保障隐私。它支持与主流AI代理框架集成,并能将常用流程编译为命令行工具以提升效率。

时间:2026-05-18 16:44
OpenClaw养虾守护进程安装与使用指南

OpenClaw养虾守护进程安装与使用指南

要让你的OpenClaw智能体实现7x24小时稳定在线与可靠运行,后台守护进程是至关重要的核心组件。它如同一位全天候值守的智能管家,不仅默默维持着Agent核心服务的生命线,还负责管理所有外部渠道的连接会话,并确保各类定时任务能够被精准、准时地调度与执行。 所有涉及守护进程生命周期管理的操作,都通过

时间:2026-05-18 16:44
PowerShell执行openclaw命令报错解决方法

PowerShell执行openclaw命令报错解决方法

许多开发者在Windows系统中配置开发工具时,都会遇到一个典型的权限问题:在PowerShell终端中输入openclaw指令后,系统提示无法执行相关脚本。 无法加载文件 C: Users xxx AppData Roaming npm openclaw ps1,因为在此系统上禁止运行脚本。 这一

时间:2026-05-18 16:43
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程