通义端到端语音交互模型FunAudioChat发布，体验高效AI对话新范式

AI热点日报时间：2025-12-23

热点解读

12月23日通义大模型发布新一代端到端语音交互模型Fun-Audio-Chat。这是通义百聆语音模型系列中，首个主打“语音对语音”交互能力的模型，支持用户直接通过语音与模型进行多轮对话。从技术指

12月23日，通义大模型正式发布新一代端到端语音交互模型Fun-Audio-Chat。该模型隶属通义百晓语音模型系列，是其首个专注于“语音对语音”直接对话能力的模型，支持用户通过语音输入与模型进行多轮自然交流。

通义端到端语音交互模型fun-Audio-Chat发布

从多项技术评测数据来看，该模型在OpenAudioBench、VoiceBench、UltraEval-Audio、MMAU、MMSU、SpeechFunctionCall等多个权威语音与多模态评测基准上，均取得了当前开源模型中的领先成绩。其综合性能超越了多款同参数规模的模型，展现出其在语音理解、生成以及对话协同方面均衡而强大的综合能力。

Fun-Audio-Chat-8B是通义百晓语音模型家族的新成员。此前，该系列已包含语音转文字模型Fun-ASR和文字转语音模型Fun-CosyVoice3。与前两者不同，Fun-Audio-Chat-8B的核心目标是实现端到端的语音交互能力，能够直接应用于语音聊天、情感陪伴、智能终端交互以及语音客服等多种实际场景。目前，该模型已在魔搭社区、Hugging Face及GitHub同步开源。

在模型训练与架构设计方面，研发团队披露了两项关键技术路径。其一是采用了Core-Cocktail两阶段训练策略，通过分阶段引入语音与多模态能力，再与原有文本大模型参数进行融合微调。这种方法有效降低了新增能力对原有语言理解能力的干扰，缓解了“灾难性遗忘”问题。其二则是引入了多阶段、多任务的偏好对齐训练，使模型在真实语音对话中能更精准地捕捉语义与情绪线索，从而显著提升对话的自然度和流畅性。

算力效率是该模型的另一大亮点。Fun-Audio-Chat-8B采用了“压缩—自回归—解压缩”的双分辨率端到端架构，将音频帧率大幅降低至约5Hz。在保证语音合成质量的同时，这一设计有望节省近50%的GPU计算开销。在当前语音大模型普遍面临算力成本压力的背景下，这一优化具有重要的工程实践意义。

综合来看，Fun-Audio-Chat-8B的开源，标志着通义大模型在语音交互方向上，正进一步朝着“低算力、强对话”的实用化阶段推进。这同时也为开源语音大模型在真实业务场景中的部署与应用，提供了新的技术思路和实践参考。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：通义端到端语音交互模型FunAudioChat发布，体验高效AI对话新范式要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://tech.ifeng.com/c/8pK9L6VFYYD

语音模型对话

上一篇：小鹏X9纯电版申报：续航750km亮点解析

下一篇：莱诺Filante纯电概念车发布：单座设计续航超1000公里

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

相关热点

AI热点2026-07-08 20:05

FL0后端应用与数据库部署指南

FL0是部署后端应用和数据库的工具，帮助开发者快速启动应用和数据库，省去环境配置与运维。适合需要快速交付后端服务的团队，支持SpringBoot、Node js与Postgres。具备自动扩展、多环境支持、GitHub深度集成等特色，还可基于Postgres构建LLM应用，实现“少操心、快上线”。

AI热点2026-07-08 20:05

Conju AI应用构建：LLM驱动跟进与CRM集成

Conju是一款由大语言模型驱动的AI工具，能自动回复未接来电、捕捉客户需求、提供初步估价并更新CRM系统，将丢失的电话转化为销售机会，尤其适合家庭服务行业，可免费快速搭建。

AI热点2026-07-08 20:05

FlirtFlix AI虚拟伴侣，支持双向语音图像文字聊天

FlirtFlix是一款提供虚拟伴侣的AI产品，支持双向语音、图像和文字聊天。用户可与多个具有独特性格的角色进行情感交流，实现无缝互动。产品定价灵活，适配不同使用频率与深度需求。

AI热点2026-07-08 20:05

Wingman AI约会教练专业智能恋爱辅导助你提升约会技巧

在线上约会过程中，许多人都会遇到“卡壳”的窘境——照片难以抉择、开场白不知如何开口、消息发出去后便杳无音讯。倘若有一位直率又专业的在线约会教练，帮你把个人资料打磨到最佳状态，还能传授聊天技巧，那该多么省心？这正是 Wingman live 这款 AI 约会助手所做的事情。什么是Wingman li

延伸阅读

iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态真我828真粉节揭晓：10000mAh超大电池手机即将亮相？苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套刘志强：京东方坚持开放合作，拒绝低质低价竞争 Redmi K90系列全系标配5000万长焦与3D超声波指纹，配置再升级 vivo X300系列曝光：天玑9500+2亿像素主摄，长焦微距实力升级

日榜
周榜
月榜

01 / 08-26iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 02 / 08-26iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 03 / 08-26真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 04 / 08-26苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别 05 / 08-27对话元戎启行周光：VLA模型核心成本在AI芯片，辅助驾驶方案交付近10万套

01 / 本周Doko AI 企业智能聊天机器人创建部署服务 02 / 本周Prompt Masters 创作灵感存储分享查找终极工具 03 / 本周AI语音对话助你提升社交与约会技能 04 / 本周自然对话生成语音人工智能技术深度剖析 05 / 本周Mottle Bot无代码平台功能详解与使用指南

01 / 本月Doko AI 企业智能聊天机器人创建部署服务 02 / 本月Prompt Masters 创作灵感存储分享查找终极工具 03 / 本月AI语音对话助你提升社交与约会技能 04 / 本月自然对话生成语音人工智能技术深度剖析 05 / 本月Mottle Bot无代码平台功能详解与使用指南

热点快看

07-08 20:04Doko AI 企业智能聊天机器人创建部署服务 07-08 20:04Prompt Masters 创作灵感存储分享查找终极工具 07-08 20:04AI语音对话助你提升社交与约会技能 07-08 20:03自然对话生成语音人工智能技术深度剖析 07-08 20:03Mottle Bot无代码平台功能详解与使用指南

热点追踪

持续追踪iPhone 17系列液态硅胶壳曝光：8色可选+挂绳孔设计 持续追踪iOS 26整合ChatGPT-5：AI全面赋能苹果智能生态 持续追踪真我828真粉节揭晓：10000mAh超大电池手机即将亮相？ 持续追踪苹果折叠iPhone曝光：搭载自研C2基带芯片与Touch ID指纹识别