腾讯混元大模型1.5发布:功能亮点与性能详解
12月17日消息,腾讯混元世界模型1.5(Tencent HY WorldPlay)于今日正式发布。据介绍,混元世界模型1.5是该领域首个开源的、涵盖最系统全面的实时世界模型训练体系,覆盖数据、训练、流式推理部署等全链路、全环节。模型创新性地集成了重构记忆力、长上下文蒸馏、以及基于3D的自回归扩散模型强化学习等核心算法模块。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

此次发布的最新介绍如下:
世界建模的新突破:实时交互、前后一致
混元世界模型1.5带来了世界建模的更多可能性。用户能够在模型生成的场景中进行自由移动和探索。当用户离开某个区域后再次返回时,模型能够“记住”该区域的三维结构,呈现出前后一致的场景画面——这种空间记忆能力,标志着模型在三维世界理解上取得关键进展。此外,用户还可以将用于交互的3D场景导出为可多次使用的3D点云文件。
混元世界模型1.5具备三大核心能力:
1、实时的交互生成:通过创新的Context Forcing蒸馏方案以及流式推理优化,模型能够按照24 FPS的帧率生成720P的高清视频;
2、长范围的3D一致性:凭借重构记忆机制(Reconstituted Memory),模型支持分钟级内容的高保真几何一致性生成,可用于构建高质量的3D空间模拟器;
3、多样化的交互体验:混元世界模型可广泛适配不同风格的游戏或现实场景,以及第一和第三人称视角,同时也支持实时文本触发事件和视频续写等功能。
业内首次系统性开源实时世界模型完整训练体系
技术上,混元世界模型1.5首次开源了业界最系统、最完整的实时世界模型训练体系,覆盖从数据准备、模型训练到推理部署的全链路和全环节。混元团队在技术报告中公开了模型预训练、持续训练、自回归视频模型强化学习、带记忆力的模型蒸馏等训练细节,并详细阐述了模型在控制空间(control space)、记忆(reconstituted memory)、蒸馏(context forcing)、强化学习后训练几大模块上的设计思路与原创考量。

混元世界模型1.5的核心是一个名为WorldPlay的自回归扩散模型,它采用Next-Frames-Prediction的视觉自回归任务进行训练,实现了长范围几何一致性的实时交互式世界建模,突破了业界同时满足实时性与几何一致性的技术难题。
模型依托三大核心创新:双分支动作表征实现精准控制、上下文记忆重构机制保持几何一致性、上下文对齐蒸馏技术增强长视频生成的视觉质量和几何一致性。除此之外,该工作还构建了一套新颖的基于3D奖励的强化学习后训练框架,进一步提升生成视频的视觉效果。数据方面,混元团队构建的自动化3D场景渲染流程,可以自动生成大量高质量的真实世界渲染数据,进一步激发核心算法的潜力。混元世界模型1.5可支持24帧/秒的长时流式生成,其高质量与泛化能力能够适配多样化场景。
腾讯混元团队持续深耕世界模型技术。今年7月,腾讯混元团队发布了混元3D世界模型1.0,能够根据文本或单张图片输入,生成兼容图形学管线的3D场景;10月,团队进一步发布了世界模型1.1,支持多视图或视频一键生成3D世界。而此次发布的混元世界模型1.5,则为世界建模带来了探索实时、交互、一致性的全新可能性。
世界模型的演进不仅代表了关键技术的突破,也为“AI生成内容”开辟了广阔的想象空间:未来的AI将不只局限于生成文本或图像等静态内容,而是能够创造一个可实时探索、可交互、空间一致、逻辑连贯的完整动态“世界”。
这种全新的内容生成模式,可应用在多个场景中:在AI游戏开发领域,它可以作为智能关卡生成器,根据玩家描述实时创造可探索的游戏世界;在影视制作和虚拟现实(VR)领域,创作者通过简单的文本指令,就能快速预览和迭代场景设计;在具身智能(Embodied AI)研究领域,混元世界模型1.5提供了一个理想的训练和测试平台,研究者可以借助这个平台,以更高的效率、更大的规模,探索具身智能体的感知、决策、规划与长期交互能力。
在线体验:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay
Github 链接:https://github.com/Tencent-Hunyuan/HY-WorldPlay
Hugging Face 链接:https://huggingface.co/tencent/HY-WorldPlay
项目主页:https://3d-models.hunyuan.tencent.com/world/
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
千里科技全面押注“AI+车”,定位智能汽车综合解决方案提供商
4月22日,千里科技在北京五棵松M空间举行AI战略发布会,联席董事长赵明首次系统披露公司未来数年的AI发展路线,明确将自身定位从传统制造企业推向AI科技公司,并将汽车视为AI技术走向规模化落地的重要载体。这一战略转型正值智能驾驶行业从“百花齐放”向“头部集中”的关键时期,千里科技试图在L4自动驾驶商
2025年度拜耳中国科研合作奖揭晓
2025年度拜耳中国科研合作奖揭晓 来源:环球网 4月22日,拜耳与北京大学、清华大学共同揭晓了2025年度拜耳中国科研合作奖的获奖名单。这个奖项体系可不简单,包含了“拜耳讲席教授”、“拜耳研究员”、“拜耳科研转化基金”和“拜耳博士后”等多个重量级奖项。话说回来,这并非一次孤立的评选,而是拜耳与中国
中汽协:1~3月前十位MPV生产企业共销售18万辆,东风公司、小鹏汽车等销量增长
4月23日,据中国汽车工业协会统计分析,2026年1-3月,销量排名前十位的MPV生产企业共销售18万辆,占MPV销售总量的80 9%。 这个数据意味着什么?简单来说,国内MPV市场的集中度相当高,头部十家车企就吃掉了超过八成的市场份额。市场格局,由此可见一斑。 在上述十家企业中,与去年同期相比,上
A股风电概念股集体下跌,泰胜风能跌超11%
风电板块今日承压,多只个股显著回调 今天A股市场的风电板块,整体表现有些乏力。板块内多只概念股出现了集体回调的态势。 具体来看,泰胜风能的调整幅度较为明显,跌幅超过了11%。紧随其后,天能重工的跌幅也超过了6%。行业龙头之一的明阳智能,股价下跌超过4%。此外,大金重工、天顺风能、电气风电等知名风电企
现货白银、纽约期银均跌逾2%
现货白银与纽约期银价格同步回落 市场波动说来就来。就在4月23日,贵金属市场经历了一轮明显的调整。现货白银的价格走势颇为引人关注,日内跌幅达到了2 36%,最终报收于75 945美元 盎司。无独有偶,纽约期银市场也同步承压,价格回落至每盎司76美元的关键心理关口下方,日内跌幅为2 53%。 从盘面表
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

