当前位置: 首页
科技数码
阿里云Qwen3.5-Omni全模态大模型发布

阿里云Qwen3.5-Omni全模态大模型发布

热心网友 时间:2026-03-31
转载

3月30日,阿里云正式发布Qwen3.5-Omni全模态大模型,这是Qwen系列最新一代产品,支持文本、图片、音频及音视频理解。该模型采用Hybrid-Attention MoE架构,Thinker与Talker模块均基于此架构设计。系列包含Plus、Flash、Light三种尺寸的Instruct版本,其中Plus版本支持256K长上下文,可处理超过10小时音频输入及400秒720P音视频。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在训练数据方面,模型基于海量文本、视觉素材及超过1亿小时音视频数据进行原生多模态预训练。语言能力方面,Qwen3.5-Omni支持113种语种和方言的语音识别,以及36种语种和方言的语音生成,相比前代Qwen3-Omni有明显提升。

在离线能力测试中,Qwen3.5-Omni-Plus在音频及音视频理解、推理和交互任务上取得215项子任务SOTA成绩,涵盖3个音视频Benchmark、5个音频Benchmark、8个ASR Benchmark、156个S2TT任务和43个ASR任务。通用音频理解、推理、识别、翻译及对话能力全面超越Gemini-3.1 Pro,音视频理解能力达到同尺寸Qwen3.5模型水平。

该模型具备音视频caption能力,可生成可控、详细、结构化的音视频描述,支持自动切片、时间戳打标及人物与音频关系描述。通过原生多模态Scaling,模型还涌现出根据音视频指令直接进行coding的能力,称为Audio-Visual Vibe Coding。

实时交互方面,模型支持五项核心功能。一是语义打断,基于Omni开发自动识别turn-talking意图,避免无效背景音干扰。二是原生支持WebSearch和复杂FunctionCall调用,可自主判断是否启用搜索。三是端到端语音控制和对话,支持对声音大小、语速、情绪等自由控制。四是音色克隆,用户可上传音色定制AI Assistant声音。五是ARIA技术,通过自适应速率交错对齐解决流式语音交互中因文本与语音Token编码效率差异导致的漏读、误读问题。

模型延续Thinker-Talker架构,Thinker通过Vision Encoder和Aut接受视觉和音频信号,Talker负责接收多模态输入及文本输出进行contextual语音生成。不同于前代双轨Talker输入,新版本采用ARIA动态对齐文本与语音单元。

用户可通过Qwen Chat、HuggingFace及ModelScope体验离线及实时Demo,也可通过阿里云百炼调用API。模型提供中英主音色5个、中英场景音色19个、中文方言特色音色8个、多语言音色23个,共计55个发音人选项。

来源:https://www.163.com/dy/article/KPA567A40519U3I5.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
机械师推出曙光 Pro 电脑主机:搭载 14 代酷睿 CPU,10499 元起

机械师推出曙光 Pro 电脑主机:搭载 14 代酷睿 CPU,10499 元起

机械师曙光Pro电竞主机首发开售:14代酷睿+RTX 50系双芯组合,配置价格全解析 近日,机械师旗下新款曙光Pro高性能游戏主机已在京东平台正式开售。对于近期计划购置高性能整机的玩家与创作者而言,这款搭载新一代硬件组合的机型无疑提供了值得重点考量的新选择。下面我们将全面解析其核心配置与首发价格信息

时间:2026-04-04 16:14
小米官宣涨价!卢伟冰罕见回应 内存涨价扛不住了

小米官宣涨价!卢伟冰罕见回应 内存涨价扛不住了

今日,小米针对旗下部分热门在售机型发布建议零售价调整公告,此举在智能手机业内引发广泛关注与讨论。 调价详情 本次价格调整主要覆盖REDMI系列的三款主力机型,详细情况如下: REDMI K90 Pro Max官方建议零售价正式上调200元; REDMI Turbo 5与Turbo 5 Max两款机型

时间:2026-04-04 11:21
显卡安全警报!经典攻击拿捏N卡:RTX 3060/A6000等已沦陷

显卡安全警报!经典攻击拿捏N卡:RTX 3060/A6000等已沦陷

研究人员成功将经典Rowhammer攻击移植至现代GPU,引发显卡安全新挑战 显卡安全面临全新威胁:最新研究披露的GDDRHammer与GeForge攻击技术,成功利用GDDR6显存的物理缺陷发起Rowhammer攻击。这种攻击不仅能破坏GPU内部的内存隔离机制,更可进一步穿透至主机系统内存,危及整

时间:2026-04-04 11:07
iFixit 拆解苹果 AirPods Max 2 耳机,胶水仍是维修“最大敌人”

iFixit 拆解苹果 AirPods Max 2 耳机,胶水仍是维修“最大敌人”

苹果AirPods Max 2深度拆解:熟悉的配方,不变的“维修之墙” 近日,知名维修机构iFixit发布了一段备受关注的视频,他们终于对苹果新款高端头戴耳机AirPods Max 2“动了手”。拆解结果多少有些令人意外:新耳机在核心架构上,几乎就是初代产品的“复刻版”。 附上相关拆解视频如下: i

时间:2026-04-04 07:42
三星连续七年稳居全球电竞显示器市场榜首

三星连续七年稳居全球电竞显示器市场榜首

三星电子连续七年蝉联全球电竞显示器销量冠军,领跑高端游戏显示市场 三星电子在游戏显示领域的领先地位再次获得权威认证。根据国际数据公司(IDC)发布的《PC显示器季度追踪报告》显示,截至2025年,三星已连续第七年稳居全球电竞显示器品牌市场份额第一,占有率达18 9%。尤其在代表尖端显示技术的OLED

时间:2026-04-04 07:01
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程