英伟达开源Audio2Face模型:AI实时面部动画,支持多语言口型同步

9月25日最新消息,英伟达公司于日前(9月24日)正式宣布将其革命性的生成式AI面部动画技术Audio2Face模型开源发布。这一重量级开源项目包含完整的基础模型、软件开发套件(SDK)以及配套训练框架,将为游戏开发和3D内容创作领域带来AI虚拟角色制作的效率革命。
这项前沿技术通过对语音信号中的音素特征、声调变化等关键声学元素进行智能分析,能够实时驱动数字角色的面部肌肉运动,不仅实现精准的唇形同步,还能自然呈现各类情绪表情。这项技术在游戏开发、影视特效制作以及智能客服等多元场景中都具有广阔应用前景。
Audio2Face提供了两种灵活的部署方式:支持预先录制音频的离线处理模式,以及适用于动态AI角色的实时流式处理模式。据官方技术博客披露,本次开源的核心组件包括:
- Audio2Face基础SDK套件
- Autodesk Maya本地执行插件2.0版
- 适配Unreal Engine 5.5及以上版本的2.5版插件
- v2.2版本回归模型
- v3.0版本扩散模型
开放源代码的训练框架允许开发者使用自有数据集进行模型微调,以满足特定领域的定制化需求。
https://img.ithome.com/newsuploadfiles/2025/9/f7c9afa9-bf47-452e-b19f-0c895978be75.jpg?x-bce-process=image/format,f_auto" alt="英伟达开源" />
这项前沿技术目前已在产业界获得广泛认可。知名游戏开发商Survios在最新力作《异形:侠盗入侵进化版》中集成了Audio2Face技术,其面部动画制作流程效率获得显著提升。
Farm 51工作室在其备受期待的《切尔诺贝利人2:禁区》开发过程中,同样借助该技术实现了从音频到面部表情的无缝转换,大幅缩短了制作周期。工作室创新总监Wojciech Pazdur盛赞这项技术"开创了数字角色创作的新纪元"。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
印尼铜矿停产加剧供应紧张,资金抢筹铜行业资产
全球第二大铜矿突发停产事件,令本就紧张的国际铜市供给形势进一步恶化。美国矿业巨头自由港麦克莫兰公司位于印尼的铜矿因泥浆溃涌事故被迫暂停生产,初步评估显示,该事件导致公司第三季度铜和黄金销售指引分别下
阿里CEO吴泳铭:3年投3800亿加码AI基建
9 月 24 日消息,今日,杭州云栖小镇迎来了一年一度的云栖大会。在开幕式上,阿里巴巴集团 CEO、阿里云智能集团董事长兼 CEO 吴泳铭发表了主旨演讲,吴泳铭在演讲中表示,实现 AGI 已是确定
谷歌报告:90%工程师日常工作使用AI技术
9 月 24 日消息,据 CNN 23 日报道,谷歌最新研究显示,绝大多数科技行业员工在工作中使用 AI 来编写或修改代码等任务。该研究由谷歌 DORA 研究部门完成,基于全球 5000 名技术专
阿里Qwen3-Max模型发布:正式版性能业界领先
阿里巴巴在人工智能领域再推力作,正式发布旗下迄今为止规模最大、性能最强的语言模型Qwen3-Max。这款被业界视为技术突破的模型,不仅在基础架构上实现全面升级,更在多维度能力测试中展现出超越同类产品
物联网窨井液位监测系统保障城市排水安全
城市地下管网作为现代城市的“生命线”,其运行状态直接影响着城市安全。窨井作为管网系统的关键节点,液位异常不仅可能导致道路积水、设施损坏,甚至可能引发城市内涝等严重问题。传统的人工巡检方式效率低、实时
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















