腾讯推出混元Voyager3D世界模型,支持长距离一致性场景生成

9 月 2 日,腾讯正式发布了混元 3D 世界模型系列最新成果 ——HunyuanWorld-Voyager(混元 Voyager)。作为业界首个支持原生 3D 重建的超长漫游世界模型,该产品将在虚拟现实、物理仿真和游戏开发等多个领域展现出强大的空间智能应用潜力。
这款新型模型通过突破性技术,成功解决了传统视频生成在空间一致性和漫游范围上的限制。它不仅能够生成长距离且世界一致的漫游场景,还能直接输出 3D 格式视频,为开发者提供更加灵活高效的内容创作工具。
技术特性与创新突破
Voyager 模型最显著的特点是实现了"3D 输入-3D 输出"的完整流程,这与之前开源的混元世界模型 1.0 完美兼容。它不仅能扩展原有模型的漫游范围,还能提升复杂场景的生成质量,并支持对场景进行个性化风格调整。
丰富的 3D 应用功能
该模型集成了视频场景重建、3D 物体纹理生成、视频风格定制化以及视频深度估计等多项创新功能,充分展现了在空间智能领域的领先优势。用户可以通过键盘或摇杆实时控制视频画面,并保持场景的高度一致性。
技术原理详解
Voyager 创新性地将场景深度预测引入视频生成过程,融合了视频生成与 3D 建模的双重优势。通过相机可控的视频生成技术,系统能够从初始场景视图和指定相机轨迹中,实时合成视角可自由调整、空间连贯的 RGB-D 视频。
性能与成就
在斯坦福大学李飞飞团队发布的 WorldScore 世界模型基准测试中,Voyager 综合能力位居榜首。其独特的空间记忆机制和原生 3D 重建能力,使其在视频生成和 3D 重建任务中均展现出卓越表现。
开源生态与发展
腾讯混元世界模型系列开源进程持续加速。继 7 月发布 1.0 版本后,8 月又推出轻量化 Lite 版。Voyager 的发布进一步提升了模型的性能和适用范围。目前该系列开源模型下载量已位居社区榜首。
获取方式
HunyuanWorld-Voyager 现已正式上线,相关技术报告和源代码在 GitHub 和 Hugging Face 平台免费开放。
项目主页:https://3d-models.hunyuan.tencent.com/world/
GitHub:https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
Hugging Face:https://huggingface.co/tencent/HunyuanWorld-Voyager
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
亚马逊AI购物神器Lens Live上线:手机扫描实物秒找同款
9 月 3 日消息,亚马逊于周二推出了“Lens Live”,进一步加大对人工智能驱动的购物体验的投入。这是其 Amazon Lens 购物功能的全新人工智能升级版本,能让消费者通过视觉搜索发现新
OpenAI将推ChatGPT家长控制功能:自动拦截高风险对话
9 月 3 日消息,OpenAI 昨天发布新闻稿,宣布将在下月为 ChatGPT 助手添加家长控制功能,可自动监测孩子的敏感性提问并让家长及时获悉相关状态。OpenAI 表示,他们正与专精进食障碍
火山引擎上线即梦AI服务,正式开放企业API接口
9 月 3 日消息,火山引擎、即梦 AI 今日宣布,即梦 AI 正式上线火山引擎,面向企业开放 API 服务,涵盖图片生成、视频生成、数字人生成三大类多款即梦 AI 同源前沿模型。据了解,即梦 A
星门计划引领AI算力升级,重塑全球人工智能基础设施
项目概览:5000亿美元的AI超级工程星门计划(Project Stargate)作为全球最大规模的人工智能基础设施项目,正以前所未有的速度推进。这项由OpenAI、Oracle、
突破发现:随机剔除token让大模型摆脱死记硬背,金鱼损失法提升AI推理能力
训练大模型时,有时让它“记性差一点”,反而更聪明!大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法 —— 金鱼
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















