阿里发布开源AI模型Qwen3-Omni,首个端到端全模态大模型
阿里云于今日(9月23日)正式推出开源项目Qwen3-Omni、Qwen3-TTS,以及对标谷歌Nano Banana的全新图像编辑工具Qwen-Image-Edit-2509。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Qwen3-Omni作为全球首个原生端到端全模态AI模型,突破性地实现了文本、图像、音频和视频等多模态数据的同步处理能力。其创新的流式输出技术不仅支持实时文本交互,更能以自然语音方式呈现结果,有效解决了传统多模态建模必须权衡不同功能的行业难题。
这款多语言全模态基础模型具有以下显著优势:
行业领先的跨模态性能:基于文本预训练与混合多模态训练相结合的独特架构,在保持单模态文字和图像处理能力的前提下,音频及视频处理水平达到行业新高度。

在36项核心测评指标中,22项位居世界领先地位,其中的32项在开源领域保持第一。特别是在语音识别(ASR)、音频理解和语音对话等关键场景,其综合表现与Gemini 2.5 Pro旗鼓相当。

多语言支持能力:可处理119种文本语言、19种语音输入语言及10种可输出语音语言。语音输入覆盖全球主要语种,输出则包括英、中、法、德等10种常用语言。
技术创新亮点:采用MoE架构的"思考者-表达者"设计,结合AuT预训练技术实现卓越的泛化能力,并通过多码本设计实现超低延迟。
同步推出的Qwen3-TTS语音合成系统突破性地提供17种人声音色选择,每种音色均支持10种语言输出。除国际通用语种外,还特别加入了闽南语、粤语等8种中国地方方言。

在专业评测中,Qwen3-TTS-Flash的表现全面超越SeedTTS、MiniMax等竞品,在语音稳定性和音色逼真度等关键指标上达到行业最高水准。

Qwen-Image-Edit-2509作为月度迭代产品,其核心升级在于显著提升了图像编辑一致性,这一改进方向与字节最新的即梦4.0模型不谋而合。

与8月版本相比,新版主要具备三大特性:
1. 突破性支持多图合成编辑,可完美处理1-3张图像的组合场景,包括人物合影、商品展示等典型应用。
2. 单图编辑一致性获得全面提升,特别在人物肖像、商品展示和文字修改等高频使用场景表现突出。
3. 原生整合ControlNet插件,支持深度图、边缘图等多种高级图像控制方式。
此外,阿里云同期还开源了Qwen3-Next-80B-A3B-Instruct-FP8和Qwen3-Next-80B-A3B-Thinking-FP8两个专业模型。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
联想2025年目标解析:营收超6000亿,净利增97.99亿
3月31日消息,联想控股今日发布截至 2025 年 12 月 31 日止年度全年业绩公告:公司总收入为人民币 6059 45 亿元,同比增长 18%;年内归属于本公司权益持有人净利润为人民币 97
华为2025年报解析:经营稳健,持续增长符合预期
3月31日消息,华为今日发布2025年年度报告,报告显示,华为经营结果符合预期,实现全球销售收入8,809亿元人民币,净利润680亿元人民币。2025年研发投入达到1,923亿元人民币,约占全年收入
美医疗科技2025年减亏超七成 新订单猛增36%
3月31日消息,3月30日,太美医疗科技(HK2576)披露2025年度业绩报告。财报显示,公司全年实现营业收入5 13亿元,同比下降7 0%;年度亏损由2 17亿元大幅收窄至5070万元,同比减少
天数智芯首份财报:上市后年营收突破10亿
3月31日消息,上海天数智芯半导体股份有限公司(简称:“天数智芯”,股份代号:9903)今日发布截至2025年12月31日的财报。财报显示,天数智芯2025年营收为10 34亿元,较上年同期的5 4
如家出行2025年营收暴增,同比增长达114.6%背后解读
3月31日消息,3月31日,如祺出行发布截至2025年度全年业绩公告。报告期内,如祺出行核心财务指标全面向好,除录得总收入52 86亿元,同比大增114 6%,年内订单量、交易额均录得翻倍增长,利润
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

