阿里新语音模型:可定制角色与背景音乐的freestyle创作
3月2日最新消息,阿里巴巴今日正式发布了两款语音新模型:基于参考音频的声音克隆模型Fun-CosyVoice3.5,以及无需参考音频的音色设计模型Fun-AudioGen-VD。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据介绍,这两款模型均引入了强大的“指令遵循”能力,让用户可以自由控制声音的情感表达、语速快慢以及场景适配。
它们支持freestyle(自由风格模式)定制角色,适用于有声书制作、游戏配音、智能客服、播客内容、在线教育、直播互动等多个应用场景。
值得一提的是,这两款模型在同尺寸模型的基准测评中斩获了多项SOTA(最先进水平)成果。
在Seed-TTS基准测试的中文“困难案例”指标中,Fun-CosyVoice3.5表现尤为抢眼,其词错误率(Word Error Rate, WER)和说话人相似度(Speaker Similarity, SSIM)均达到最佳水平。
同时,由于优化了“困难案例”的发音表现,生僻字句错误率从原来的15.2%显著降低至5.3%。

其中,Fun-CosyVoice3.5支持freestyle指令控制,有效解决了传统克隆模型只能模仿、无法指定具体角色的痛点。
Fun-AudioGen-VD则专注于“从无到有”的音色设计。在指令遵循能力和可控性的Instruct-TTS基准测试中,其表现超越了gemini2.5-pro和gpt-4o-mini-tts。

该模型不仅能根据文字描述定制音色和情感,还能同步模拟复杂的听觉环境,实现“人物+场景”的一体化生成效果。
在强化学习训练过程中,两款模型通过采用DiffRO和GRPO技术,增加了时长和韵律多通道的奖励机制。
此外,Fun-CosyVoice3.5所使用的tokenizer帧率减半,不仅提高了训练效率,其首包延迟也降低了35%,大幅提升了实时交互体验。
即日起,用户可在阿里云百炼平台直接调用这两款最新模型。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
老头乐企业向小米致歉,撤专利无效请求达成和解
3月28日消息,山东燕鲁新能源车业有限公司(简称“燕鲁新能源”)在社交平台发布声明,就近日媒体发布的公司与小米汽车公司的专利争议致歉。燕鲁新能源称,小米公司拥有相关设计的专利权。公司在了解相关法律法
张雪峰追悼会今日举行,民众清晨排队含泪送别
3月28日消息,张雪峰追悼会暨遗体告别仪式今日上午7点在苏州殡仪馆举行,一大早门口已经有大量苏州市民自发来送张雪峰最后一程。从网上传出的视频看,民众排成将近2公里长队,不少人手捧菊花,神情肃穆,静静
知名家居品牌曝内鬼挪用亿元资金,家贼难防警示录
3月28日消息,昨晚,“中国床垫第一股”喜临门发布重磅公告,披露下属控股子公司喜途科技遭遇内部人员涉嫌利用职务之便非法挪用资金,累计1亿元银行账户资金被非法划转,引发市场震动。据悉,涉案资金从喜途科
4月石油危机:小摩绘制全球影响时间表与地图
随着美伊战争持续发酵,一场全球范围内的原油危机正在酝酿中。据摩根大通的分析师表示,过去四周霍尔木兹海峡石油运输中断将对全球供应造成“连锁”冲击,冲击将从东向西蔓延,到4月份世界大部分地区都将受到冲击
英国航空推节油奖金:省油达标可获最多1%薪资奖励
3月27日消息,在国际油价日渐高涨的背景下,据报道,英国航空正考虑推出一项奖金计划,奖励采用节油飞行操作的飞行员。报道称,根据英航向机组人员传达的提案显示:若航空公司能在2025年基准排放量基础上,
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

