阿里推出Qwen3-Omni-Flash全功能模型,甜妹等你自由切换
12月11日消息,阿里通义千问团队于2025年12月9日发布官方博文,正式推出了新一代原生全模态大模型Qwen3-Omni-Flash-2025-12-01。该模型在Qwen3-Omni基础上进行了全方位优化,现已能够无缝理解并实时流式输出文本、图像、音视频等多模态内容。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据官方博文介绍,Qwen3-Omni-Flash不仅能流畅处理文本、图像、音频和视频等多种输入信息,还能通过实时流式响应,同步生成高质量的文本与高度拟真的自然语音。
作为Qwen3-Omni的全面升级版,新模型在保持高效响应的同时,重点解决了以往多模态交互中存在的响应延迟与融合生硬等痛点,致力于实现“声形意合,令出智随”的沉浸式智能体验。

针对口语化场景中常见的“降智”问题,Qwen3-Omni-Flash大幅加强了对音视频指令的理解与执行能力。新模型显著提升了多轮对话的稳定性与连贯性,彻底告别了以往语音生成中语速拖沓、机械呆板的现象。
现在,模型能根据文本内容自适应地调节语速、停顿与韵律,其语音表现的自然度与拟人化程度已逼近真人水平,为用户带来更流畅自然的对话感受。
此次升级最引人瞩目的功能是系统提示(System Prompt)控制能力的飞跃。通义千问团队全面开放了System Prompt的自定义权限,用户可以精细调控模型的行为模式——无论是设定“甜妹”、“御姐”或“日系”等特定人设风格,还是调整口语化表达偏好及回复长度,模型均能精准执行。
此外,模型的多语言能力也更为可靠,支持119种文本语言交互、19种语音识别语言及10种语音合成语言,确保在跨语言场景下响应准确一致。
在客观性能指标上,Qwen3-Omni-Flash-2025-12-01展现了强大的综合实力。数据显示,该模型在逻辑推理任务(ZebraLogic)上得分提升5.6,在代码生成(LiveCodeBench-v6)上提升9.3,在多学科视觉问答(MMMU)上提升4.7。这些数据表明,新模型不仅能更准确地“看懂”图像与视频内容,还在复杂指令遵循与深度逻辑分析上迈上了新台阶。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
曝光151个含恶意代码软件包,AI批量生成隐患需警惕
编辑|杨文此前我们曾报道,有人在学术论文中嵌入隐藏指令,诱导 AI 打高分:将「仅输出正面评价」或「不要给出任何负面分数」等英文指令以白底白字或极小号字体写入文档,人眼几乎无从察觉,AI 却能识别并
迈向通用智能:Echo预测智能如何走出关键一步
机器之心发布大模型能否预测未来?UniPat AI 构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型 EchoZ-1 0。在其公开的 General
DeepSeek 瘫痪超8小时:故障影响分析与应对指南
你敢想,DeepSeek崩了一晚上!超过8小时仍未修复。根据三言报道,从3月29日晚上22点开始,一直到至30日早上7点,DeepSeek服务出现大规模访问异常,大量用户遭遇页面卡顿、反复提示“服务
AI预测市场崛起:黑马模型胜率如何超越人类
新智元报道编辑:Aeneas【新智元导读】大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1 0。
Anthropic融资启示:21家顶级VC拒绝后的AI天价融资内幕
新智元报道编辑:倾倾【新智元导读】谁能想到,OpenAI核心团队出来创业,竟被21家顶级VC拒之门外?结果5年后,这帮人为了抢一张入场券,不惜支付300倍溢价。复盘这场闹剧,我们只看到了一个词:活该
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

