微软开源VibeVoice-1.5B音频模型：支持中文生成，90分钟4人对话语音一键合成

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

微软开源VibeVoice-1.5B音频模型：支持中文生成，90分钟4人对话语音一键合成

热心网友时间：2025-08-28

转载

感谢网友地板轰鸣的线索投递！

8 月 27 日消息，科技媒体 marktechpost 于 8 月 25 日发布博文，报道称微软发布开源文本转语音（TTS）模型 VibeVoice-1.5B，可一次生成最长 90 分钟、最多 4 位不同说话者的自然语音，并支持跨语言及歌声合成。

在架构方面，VibeVoice-1.5B 基于 1.5B 参数的 Qwen2.5 语言模型，结合声学（Acoustic）与语义（Semantic）双分词器（Tokenizer），以 7.5Hz 低帧率处理。

声学分词器使用 σ-VAE 结构，将 24kHz 原始音频压缩至 3200 分之一；语义分词器则通过语音识别代理任务训练，保留对话语义。解码端采用 1.23 亿参数的扩散解码器，结合分类器自由引导和 DPM-Solver，来提升音质与细节表现。

该模型为确保在长篇对话中保持语音连贯性与说话人一致性，在训练中逐步扩展上下文长度，从 4k 至 65k Tokens，其架构支持多说话者的轮流发言，模拟自然对话场景，且可在流式模式下生成长音频，为未来实时 TTS 奠定基础。

VibeVoice-1.5B 也有局限，目前仅支持英语与中文，其他语言可能出现不准确或不当内容；不支持说话人语音重叠，也无法生成背景音效或音乐。微软明确禁止将该模型用于声音冒充、虚假信息传播或绕过身份验证等用途，并提醒用户遵守法律并标明 AI 生成来源。

微软表示，该模型主要面向科研和开发者社区，适合播客制作、对话式 AI、语音内容生成等领域。未来将推出参数更大的 7B 版本，支持低延迟交互和更高保真度的实时合成，进一步拓展应用场景。

附上参考地址

微软 VibeVoice-1.5B 技术报告
Hugging Face
GitHub

来源:https://www.ithome.com/0/878/264.htm

上一篇：扎克伯格再挖OpenAI核心成员，Meta加速布局AI人才争夺

下一篇：两女子行乞嫌20元少起争执，官方：进站前已有冲突，双方被带离调解

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门专题

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

日榜
周榜
月榜

iPhone 12电池充电慢的优化方法

iPhone 17防止应用频繁崩溃的实用技巧

苹果手机自定义震动设置方法

iPhone 14快速切换Wi-Fi网络的方法

iPhone16灵动岛优化设置技巧详解

苹果手机如何关闭App Store自动订阅详细图文教程

iPhone14ProMax灵动岛如何调整大小

iPhone 17如何设置应用权限管理教程

苹果手机QQ闪退的常见原因分析

iPhone14Pro灵动岛音乐控制教程

iPhone 12电池充电慢的优化方法

iPhone 17防止应用频繁崩溃的实用技巧

苹果手机自定义震动设置方法

iPhone 14快速切换Wi-Fi网络的方法

iPhone16灵动岛优化设置技巧详解

苹果手机如何关闭App Store自动订阅详细图文教程

iPhone14ProMax灵动岛如何调整大小

iPhone 17如何设置应用权限管理教程

苹果手机QQ闪退的常见原因分析

iPhone14Pro灵动岛音乐控制教程

iPhone 12电池充电慢的优化方法

iPhone 17防止应用频繁崩溃的实用技巧

苹果手机自定义震动设置方法

iPhone 14快速切换Wi-Fi网络的方法

iPhone16灵动岛优化设置技巧详解

苹果手机如何关闭App Store自动订阅详细图文教程

iPhone14ProMax灵动岛如何调整大小

iPhone 17如何设置应用权限管理教程

苹果手机QQ闪退的常见原因分析

iPhone14Pro灵动岛音乐控制教程

相关攻略

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

2026-07-05 13:32

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

2026-07-05 13:31

云南以旧换新补贴扩围新增智能影音与无人机

2026-07-05 13:31

小米Redmi 7英寸高性能手机传闻即将发布

2026-07-05 13:30

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

2026-07-05 13:30

Caviar抢先发布定制版iPhone Ultra折叠屏售价13840美元起

2026-07-05 13:30

佳能EOS R8 Mark II全画幅无反9月发布复古设计成亮点

2026-07-05 13:30

System76 Adder Pro 15.3笔记本顶配酷睿Ultra 7与RTX 5070

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

梦之形手机版阿鬼角色技能解析与实战表现发布于 2026-07-06

红色沙漠暗影主宰成就完成攻略发布于 2026-07-06

Garden-in新滤镜成就解锁攻略发布于 2026-07-06

王者荣耀世界光追开启位置指南发布于 2026-07-06

绘旅人助战攻略详解高效助战技巧与策略发布于 2026-07-06

息风谷战略仙竹海副本通关攻略与高效刷本技巧发布于 2026-07-06

怪物猎人崛起百龙渊源探索终极挑战与隐藏秘密发布于 2026-07-06

热门出租车模拟游戏：真实城市接单驾驶乐趣发布于 2026-07-06

Win11频繁断网提示默认网关不可用怎么办发布于 2026-07-03

Mac如何取消正在进行的系统备份任务发布于 2026-07-03

电脑显示器刷新率锁死60Hz无法调整的解决方法发布于 2026-07-03

Linux系统下Systemd服务管理从零开始方法步骤详解完整教程发布于 2026-07-03

雅迪电动车各型号电量显示图超详细解析发布于 2026-07-06

内存卡在电脑上显示未格式化的解决方法发布于 2026-07-06

惠普笔记本重启后如何顺利进入BIOS设置发布于 2026-07-06

小天鹅洗衣机童锁误开快速关闭教程发布于 2026-07-06

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

微软开源VibeVoice-1.5B音频模型：支持中文生成，90分钟4人对话语音一键合成

最新消息称国行苹果iPhone 18 Pro Max电池容量达到了5391mAh增幅11.78%

HMD发布四款诺基亚功能手机 配备AI按键与可拆卸电池

云南以旧换新补贴扩围 新增智能影音与无人机

小米Redmi 7英寸高性能手机传闻即将发布

深光影像AF35mmF2.2CE全画幅镜头E/L卡口739元起售

HMD发布四款诺基亚功能手机配备AI按键与可拆卸电池

云南以旧换新补贴扩围新增智能影音与无人机