当前位置: 首页
AI
通义千问Qwen3-TTS两款AI语音模型发布:支持定制与声音复刻

通义千问Qwen3-TTS两款AI语音模型发布:支持定制与声音复刻

热心网友 时间:2025-12-24
转载

12月24日消息,阿里通义今日正式发布Qwen3-TTS家族的两款全新模型:音色创造模型Qwen3-TTS-VD-Flash与音色克隆模型Qwen3-TTS-VC-Flash。两款模型的主要特性如下:

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

音色创造:Qwen3-TTS-VD-Flash支持用户通过复杂、自然的语言指令输入,实现对音色、韵律、情感乃至人设的精细化调控。它让用户能够全面掌控从“说什么”到“如何说”的整个过程,自由定义心中想要的语音特质。这彻底改变了以往只能克隆现有音色,或是在有限预设音色库中进行选择的局面。
在InstructTTS-Eval评测中,其综合表现显著优于GPT-4o-mini-tts和Mimo-audio-7b-instruct;在角色扮演测试中也超越了Gemini-2.5-pro-preview-tts。

音色克隆:Qwen3-TTS-VC-Flash支持仅需3秒音频即可完成音色克隆,并能基于克隆出的音色,生成涵盖中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等10大主流语言的语音。
在MiniMax TTS Multilingual Test Set上,其平均词错误率(WER)全面低于MiniMax、ElevenLabs及GPT-4o-Audio-Preview。

高表现力:无论是Qwen3-TTS-VD-Flash还是Qwen3-TTS-VC-Flash,都具备高度拟人化的自然音色。它们能够稳定、可靠地输出与文本内容高度契合的语音,并依据文本语义自动调节语气节奏,呈现出自然生动的表达效果。

鲁棒的文本能力:两款模型均拥有强大的文本解析能力,可自动处理复杂文本结构,精准提取关键信息。对于多样化、非规范化的文本格式,都展现出较强的鲁棒性(注:鲁棒性指系统在面临内部结构或外部环境的变化时,维持功能稳定运行的能力)。

Qwen3-TTS-VD-Flash

该模型支持用户通过自然语言描述来生成定制化的音色形象。您只需随意输入有关声学属性、人设描述、背景信息等自由描述,即可轻松创造出自己期望的语音形象。

可控的生成质量:在InstructTTS-Eval评测中,Qwen3-TTS的综合表现显著优于GPT-4o-mini-tts和Mimo-audio-7b-instruct;在角色扮演测试中也超越了Gemini-2.5-pro-preview-tts。

阿里通义 Qwen3-TTS 家族上新两款 AI 模型:声音不仅能复制,还可以定制

Qwen3-TTS-VC-Flash

该模型支持通过自然语音进行3秒级别的音色克隆。基于克隆出的音色,可生成多语种音频,同时对复杂文本和带有环境背景音的“野生”音频都具有较高的处理鲁棒性。

多语种音色克隆:在MiniMax TTS Multilingual Test Set上,Qwen3-TTS在中、英、法、意等语种的内容稳定性方面优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview;其平均词错误率(WER)也位居第一。

阿里通义 Qwen3-TTS 家族上新两款 AI 模型:声音不仅能复制,还可以定制

Qwen3-TTS-Voice-Design API 文档:

https://www.alibabacloud.com/help/zh/model-studio/qwen-tts-voice-design?spm=a2ty_o06.30285417.0.0.56a0c9216Ey6VM

Qwen3-TTS-Voice-Clone API 文档:

https://www.alibabacloud.com/help/zh/model-studio/qwen-tts-voice-cloning?spm=a2ty_o06.30285417.0.0.56a0c921WnHNlN

来源:https://www.ithome.com/0/907/705.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
华为AI深度布局:如何引领科技变革新格局

华为AI深度布局:如何引领科技变革新格局

新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王

时间:2026-03-28 18:52
Claude限流,Altman紧急叫停Sora:AI竞争格局改变

Claude限流,Altman紧急叫停Sora:AI竞争格局改变

新智元报道编辑:元宇【新智元导读】Sora应用关停,Claude却因太火而被限流:一个烧不起,一个供不上,算力墙面前,AI竞赛的胜负手突然变了。一夜之间,打工人突然发现:Claude开始限流了。An

时间:2026-03-28 18:46
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而

时间:2026-03-28 16:58
OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险

OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险

新智元报道编辑:倾倾【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「

时间:2026-03-28 16:52
华为大模型负责人离职,重大人事变动引发行业关注

华为大模型负责人离职,重大人事变动引发行业关注

智东西作者|江宇编辑|冰倩智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。在

时间:2026-03-28 16:46
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程