腾讯混元开源Hunyuan-Foley:视频文字生成电影级音效,端到端AI模型

8 月 28 日消息,腾讯混元今天午间宣布开源端到端视频音效生成模型 Hunyuan-Foley,用户只需输入视频和文字,就能为视频匹配电影级音效。
根据最新介绍,HunyuanVideo-Foley 不仅打破了 AI 生成的视频只能“看”不能“听” 的局限,让无声 AI 视频成为历史,更是真正做到了“看懂画面、读懂文字、配准声音”,带来沉浸式视听体验。这款音效生成工具可广泛应用于短视频创作、电影制作、广告创意和游戏开发等场景。
文字描述:Engine revving loudly and accelerating.
文本描述:Rustling and crunching of leaves and twigs under the fox kit's paws.
混元团队开发了一个全面的数据处理管道,能够自动化标注和过滤收集的音视频数据,构建了约 10 万小时级的高质量 TV2A 数据集,为模型训练提供了强大支撑,使得模型拥有强大的泛化能力,能够在各种复杂的视频条件下生成音画一致、语义对齐的高质量音频,包括音效与背景音乐。生成的音频能够与无声视频相结合,极大提升了视频的真实感和沉浸感。
附有关链接如下:
体验入口:https://hunyuan.tencent.com/video/zh?tabIndex=0
项目正式:https://szczesnys.github.io/hunyuanvideo-foley/
代码:https://github.com/Tencent-Hunyuan/HunyuanVideo-Foley
技术报告:https://arxiv.org/abs/2508.16930
Hugging Face:https://huggingface.co/tencent/HunyuanVideo-Foley
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
中国移动自研大云海山数据库通过安全测评,适配国产CPU与操作系统
8 月 29 日消息,中国信息安全测评中心与国家保密科技测评中心于 8 月 22 日发布《安全可靠测评结果公告(2025 年第 2 号)》,其中中国移动自研移动云“大云海山数据库”(He3DB f
日产与东风合资公司获批,将专注电动汽车出口业务
8 月 29 日消息,市场监管总局今日公布了 2025 年 8 月 18 日 —8 月 24 日无条件批准经营者集中案件列表。注意到,其中包括科威特控股石化工业公司收购万华化学(烟台)石化有限公司
Xbox跨设备游玩记录上线:多端同步游戏进度,云端作品随时畅玩
8 月 29 日消息,微软 Xbox 宣布全面推出跨设备游戏记录功能。此次更新后,无论玩家使用的是另一台 Xbox 主机、Ally 掌机还是电脑,近期游玩的游戏列表都将保持一致,让玩家能直接从中断
上汽奥迪回应一汽奥迪:116年前奥迪创始标识即为“AUDI”
8 月 29 日消息,近日,奥迪 E5 Sportback 开启预售,23 59 万的价格超出很多消费者预期,但字母标也引发争议,上汽奥迪营销事业副总经理谢施奇在成都车展上对此进行了回应。他表示,
《崩坏:因缘精灵》实机演示首曝,米哈游新作开启测试招募
8 月 29 日消息,继昨天发布首条视频后,米哈游崩坏 IP 新作《崩坏:因缘精灵》今天通过最新账号公布了该作的首部“结缘 PV”及实机演示。 同样是今天,该作开启“结缘测试”招募,截止日期为
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















