通义千问开源语音模型:省下近50%的GPU算力
12月24日消息,通义百聆家族近日开源新一代语音交互模型Fun-Audio-Chat-8B。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
新模型融合高智商与高情商,具备出色的共情能力,对话如同与懂你的人聊天般自然。
在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU、SpeechFunctionCall等权威基准评测中,Fun-Audio-Chat-8B斩获SOTA成绩,超越同量级开源模型。

目前,百聆家族成员已覆盖“会说话”的语音转文字模型Fun-ASR和“听得懂”的文字转语音模型Fun-CosyVoice3。
最新开源的模型Fun-Audio-Chat-8B主打语音对语种功能,实现了“能听会说”。
用户可与模型直接进行音频对话,适用于语音聊天、情感陪伴、智能设备和语音客服等多种场景。
即使没有任何情绪标签或提示词,它也能通过语义、语气、语速、停顿、重音等细微信号,感知对方的情绪状态,并给出恰到好处的关切、安慰或鼓励式回应。
此外,用户还能尝试角色扮演,量身定制语音的情绪、说话风格、语速、高低音和音量等。

而模型之所以能保持“原有智商”,主要得益于两项创新的音频模型训练模式。
一是采用Core-Cocktail两阶段训练策略。先快速学习新本事,再将“新本事”和“老底子”融合起来。为了避免在掌握新技能时遗忘原有能力(灾难性遗忘),第一阶段训练得到的模型会与原始纯文本大模型的参数先行合并,再进行微调。
二是与人类偏好对齐。通过多阶段、多任务的后训练设计,模型能更好地理解真实对话场景中用户的语音内容与情绪线索,从而做出更自然、更符合人类期待的回应。
值得注意的是,新模型通过压缩→自回归→解压缩的双分辨率的端到端设计,将音频帧率降到业界最低的5Hz,在保证语音质量的同时节省近50% GPU计算资源。

目前,用户可在魔搭社区、Hugging Face和GitHub下载模型自行体验。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
周鸿祎对话刘慈欣:软件行业两三年内将迎来剧变
3月28日消息,近日,在2026中国科幻大会上,360集团创始人周鸿祎与科幻作家刘慈欣、中国科学院高能物理研究所研究员张双南同台,就人工智能对人类文明的影响、AI与科学研究的融合、人类未来的生态位等
马斯克七旬母亲游长城,姿态矫健引网友赞叹
3月28日消息,美国企业家埃隆·马斯克的母亲梅耶·马斯克,近日在社交平台分享了自己游览中国长城的视频动态。此次她到访八达岭长城,全程精神矍铄、步履轻盈,丝毫看不出已是年过七旬。她还特意在 “不到长城
周鸿祎对话刘慈欣:AI引爆科幻大会,预言智能体新纪元
日前,2026中国科幻大会在北京石景山区首钢园举办。在“科幻与技术融合创新论坛”对话环节,360集团创始人周鸿祎与科幻作家刘慈欣、中国科学院高能物理研究所研究员张双南同台,就人工智能对人类文明的
印度50岁教授课堂向女生求婚 遭围殴视频引关注
3月28日消息,近日,印度班加罗尔一段争议视频引发热议:一名50岁的医学院助理教授,竟在课堂上当着全班学生的面,向一名女学生公开求婚,后续遭到学生们围殴。据相关视频显示,涉事教授在课堂上宣称:“我无
骑手心声:全网寻人后续,孩子平安是最好的消息
3月28日消息,近日深圳一位母亲发帖寻找美团骑手的消息引发广泛关注。据悉,当时这位母亲抱着突发抽搐的孩子在医院附近体力不支,情况万分紧急。 一名路过的骑手见状主动载着母子俩直奔急诊门口,不仅帮她节省
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

