当前位置: 首页
AI资讯
阿里通义千问Qwen3.5多模态大模型开源发布

阿里通义千问Qwen3.5多模态大模型开源发布

热心网友 时间:2026-05-24
转载

Qwen3.5是什么

大模型领域的竞争,正从单纯的参数规模竞赛,转向对效率、成本和通用性的综合考量。在这个背景下,阿里巴巴通义千问团队推出的Qwen3.5,可以说是一次极具代表性的技术跃迁。

简单来说,Qwen3.5是新一代原生多模态大模型。它的首发开源版本Qwen3.5-397B-A17B,采用了一种创新的混合架构,巧妙地将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术结合了起来。这套组合拳的效果非常显著:模型总参数高达3970亿,但每次推理时仅激活170亿参数。这种“四两拨千斤”的设计,让它实现了“以小胜大”——性能上超越了万亿参数的Qwen3-Max,同时部署所需的显存降低了60%,推理吞吐量最高提升了惊人的19倍。

作为原生视觉-语言模型,它通过早期文本-视觉融合技术,以及M-RoPE、3D位置编码等创新,能够统一处理文本、图像、视频等多种任务。语言支持也从119种大幅扩展至201种,覆盖面更广。

性能表现如何?数据最有说服力。在多项权威评测中,Qwen3.5的成绩相当亮眼:MMLU-Pro得分87.8,超越了GPT-5.2;GPQA得分88.4,高于Claude 4.5;IFBench指令遵循评分更是达到了76.5,刷新了历史纪录。更关键的是,它的API定价极具竞争力,每百万Token仅需0.8元,这个价格仅为Gemini 3 Pro的1/18。对于开发者而言,可以通过魔搭社区、HuggingFace或阿里云百炼平台获取模型权重与接口。

除了这个“大块头”,阿里千问还同步推出了更小尺寸的Qwen3.5系列模型,包括0.8B、2B、4B和9B等版本。全系基于统一的Qwen3.5基座,采用Apache 2.0协议开源且可商用,支持LoRA或全量微调。这意味着,用消费级显卡就能启动任务适配,大大降低了在垂直场景中落地的成本和门槛。其中,0.8B和2B版本非常适合移动设备和IoT边缘部署;4B版本定位为轻量级智能体基座;而9B版本的性能,据称已可媲美一些120B级别的开源模型。

Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

Qwen3.5的主要功能

那么,这个模型具体能做什么?它的能力矩阵覆盖得相当全面:

  • 原生多模态理解:不再是简单的文本模型外设视觉模块,而是从底层统一处理文本、图像、视频,通过早期视觉-语言融合实现真正的跨模态推理。
  • 智能体能力:支持工具调用、任务规划与自主执行,在BFCL-V4等智能体专项评测中表现优异,具备了成为“数字员工”的潜力。
  • 高效推理架构:前面提到的Gated DeltaNet与MoE混合设计是核心,让397B参数的“巨兽”每次只需“唤醒”17B参数就能工作,实现了顶级性能与高效成本的平衡。
  • 长上下文处理:最高支持1M(百万级)的上下文长度。在256K场景下,解码吞吐量能达到前代模型的19倍,处理长文档、长视频不再是瓶颈。
  • 多语言支持:覆盖201种语言与方言,词表扩展至25万,编码效率提升了10%到60%,为全球化应用扫清了语言障碍。
  • 代码生成:具备强大的编程能力,支持多种语言的代码编写、调试,甚至能参与复杂项目的开发工作。
  • 视觉识别:不仅能看懂图片,还能进行细粒度图像理解、目标检测、OCR文档解析与空间关系推理,视觉能力更加深入。
  • 搜索增强:集成了BrowseComp等搜索智能体能力,可以实现联网信息检索与整合,让模型的知识获取能力突破训练数据的时间限制。

Qwen3.5的技术原理

这些强大功能的背后,是一系列扎实的技术创新作为支撑:

  • 混合注意力架构:融合了Gated DeltaNet线性注意力与Gated Attention稀疏注意力,让模型能够自适应地分配计算资源,该省则省,该花则花。
  • MoE稀疏激活:这是实现高效推理的关键。总参数397B,但每次只激活17B(约4.3%)。其结构包含1个共享专家和512个路由专家,每次推理仅激活其中的10个,大幅降低了计算成本。
  • 门控机制优化:采用head-specific sigmoid门控替代了传统的softmax注意力,这项优化因其显著的效果,获得了2025年NeurIPS的最佳论文奖。
  • 原生多模态融合:利用M-RoPE和3D位置编码技术,将图像、视频的时空信息原生地嵌入到大语言模型中,实现了视觉与语言在早期阶段的深度融合,而非后期拼接。
  • 异构训练框架:视觉与语言组件采用解耦并行策略,结合稀疏激活实现了跨模块的计算重叠,使得多模态训练吞吐量接近纯文本基线,解决了训练效率的难题。
  • FP8混合精度:原生支持FP8流水线,对激活值、MoE路由与通用矩阵乘法采用低精度处理,仅在敏感层保持BF16精度,使得训练显存需求降低50%以上。
  • 异步强化学习:构建了一个可扩展的异步强化学习框架,能够支持全尺寸模型的RLHF训练,实现了训练与推理的分离以及动态负载均衡,端到端加速达到3-5倍。
Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

Qwen3.5的项目地址

对于想要深入研究或直接使用的开发者和研究者,可以访问以下官方渠道获取资源:

  • Hugging Face模型库:https://huggingface.co/collections/Qwen/qwen35
  • GitHub仓库:https://github.com/QwenLM/Qwen3.5

如何使用Qwen3.5

无论你是普通用户、开发者还是企业,都有多种方式可以体验和利用Qwen3.5:

  • 网页端体验:最直接的方式是访问Qwen Chat官网,或者下载千问APP/PC客户端,直接输入文字或上传图片、视频进行多模态交互。
  • API调用:通过阿里云百炼平台获取API密钥,就能以每百万Token 0.8元的极低成本,将模型能力集成到自己的应用或服务中。
  • 本地部署:从HuggingFace或魔搭社区下载开源权重Qwen3.5-397B-A17B及其小尺寸版本,在本地或私有云环境进行部署,满足数据安全和定制化需求。
  • 智能体开发:利用模型原生的智能体能力,结合其工具调用接口,可以开发自动化任务执行、数据分析、智能决策等高级应用。
  • 多语言应用:直接使用201种支持语言中的任意一种进行对话,无需额外配置翻译模块,非常适合开发全球化产品。
  • 长文档处理:上传超长文本、PDF或视频文件,模型能自动处理最高1M上下文的复杂推理任务,如长篇报告分析、会议纪要总结等。

Qwen3.5的模型定价

成本始终是技术落地的重要考量。Qwen3.5在定价策略上展现了强大的竞争力:

  • 输入价格:通过API调用,每百万Token仅需0.8元,这无疑是全球顶级大模型中最低的价位之一。
  • 价格对比:这个价格仅为Gemini 3 Pro的1/18,GPT-5.2的1/15,性价比优势非常显著。
  • 开源免费:最重要的是,Qwen3.5-397B-A17B及其系列小模型的权重完全开源,开发者可以免费下载并进行本地部署,这极大地降低了研究和商业化的初始门槛。

Qwen3.5的应用场景

结合其功能与成本优势,Qwen3.5能在多个领域大显身手:

  • 智能客服:支持201种语言的多轮复杂对话,能完美适配全球化企业的客服系统,提供7x24小时的多语言服务。
  • 内容创作:辅助进行多语言的文案撰写、视频脚本生成、翻译与本地化内容适配,提升创作效率。
  • 代码开发:作为编程助手,提供代码生成、调试、重构乃至复杂项目开发维护的支持,成为开发者的“副驾驶”。
  • 视觉分析:应用于图像识别、文档OCR、视频内容理解与细粒度视觉问答,为安防、医疗、零售等行业提供智能分析能力。
  • 智能体自动化:构建自动化工作流,执行数据分析、信息检索、任务调度等智能体任务,实现业务流程的智能化升级。
  • 教育辅助:支持多语言教学、智能作业批改、个性化学习路径规划与互动知识问答,打造自适应学习体验。

总的来看,Qwen3.5不仅仅是一次模型迭代,它更代表了一种务实的技术方向:在追求极致性能的同时,将效率、成本和易用性摆在同等重要的位置。它的出现,无疑为AI大规模落地应用提供了又一个强有力的选项。

来源:https://ai-bot.cn/qwen3-5/

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
上海AI Lab推出InternSVG统一SVG建模套件

上海AI Lab推出InternSVG统一SVG建模套件

在矢量图形(SVG)处理领域,传统的解决方案往往是割裂的:一个模型负责理解,另一个负责生成,编辑则需要手动调整代码。这种模式不仅提高了使用门槛,也限制了AI在复杂专业场景中的应用深度。近期,由上海人工智能实验室等机构联合推出的开源项目InternSVG,正致力于打破这一僵局,构建一个统一的SVG智能

时间:2026-05-24 09:05
谷歌Gemma 4多模态大模型系列全面解析

谷歌Gemma 4多模态大模型系列全面解析

近日,谷歌正式发布了备受瞩目的Gemma 4开源大模型系列,为AI领域带来了一套覆盖从边缘设备到云端服务器的“全栈式”解决方案。其核心理念在于:通过极致的参数效率,在更小的模型体积下实现媲美甚至超越百亿参数大模型的性能,并将强大的多模态AI能力无缝部署至您的手机及各类边缘计算设备中。 简而言之,Ge

时间:2026-05-24 09:04
B站AI视频助手updream创作工具使用指南

B站AI视频助手updream创作工具使用指南

对于在B站长期耕耘的内容创作者而言,如何在保持高效产出的同时,坚守独特的个人风格,始终是一个核心挑战。频繁更新带来的重复性劳动与创意枯竭的风险,是许多UP主共同面对的难题。近期,B站官方推出的专业级AI视频创作助手“updream”,正是为了解决这一痛点而生。它并非简单的视频生成器,而是定位为资深创

时间:2026-05-24 09:04
叽伴AI情感陪伴应用:趣丸科技打造的心灵伙伴

叽伴AI情感陪伴应用:趣丸科技打造的心灵伙伴

在AI情感陪伴领域,产品同质化现象日益凸显,许多应用仍停留在基础的一问一答式聊天机器人层面,缺乏深度互动与长期成长性。然而,近期一款名为“叽伴”的应用,正尝试以全新的“羁绊养成”逻辑打破这一僵局,为市场带来新的思考。 简而言之,叽伴不再局限于让AI扮演一个被动应答的“树洞”,而是致力于成为一位能够记

时间:2026-05-24 09:04
Claude Code缓存实战指南一周节省3亿Token成本

Claude Code缓存实战指南一周节省3亿Token成本

编者按:许多开发者在体验 Claude Code 时,普遍反映 Token 消耗速度过快,尤其在长会话场景下,额度更容易见底。但从工程效率角度分析,真正决定成本的关键,往往不在于你新增了多少代码,而在于系统能否高效复用已经处理过的上下文信息。 本文将深入解析如何通过缓存机制显著降低 Token 消耗

时间:2026-05-24 09:04
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程