数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

阿里通义千问3.5评测：实测能力为何超越预期？

阿里通义千问3.5评测：实测能力为何超越预期？

热心网友时间：2026-02-17

转载

大模型领域的“春晚”频率，已经快让从业者跟不上节奏了。

2月16日除夕夜，阿里巴巴开源全新一代大模型千问Qwen3.5-Plus，性能媲美Gemini 3 Pro，登顶全球最强开源模型，不论从哪个方面，都可以说是给大模型行业的蛇年画上一个句号。

Qwen3.5-Plus总参数3970亿，但实际运行时的激活参数仅为170亿，性能就超过了万亿参数的Qwen3-Max模型，算力部署成本降低60%，推理速度提升8倍，更别提还是一个原生多模态模型，Agent能力大幅加强，API价格每百万Token低至0.8元。

更好、更快，还更省钱了，这当然不是千问独有的特性，但千问是毫无争议的标准答案，知道怎么做和做出来，是两回事——大模型就是一帮这个星球上最聪明的大脑，在做最复杂的实现。

稍早时间，字节跳动、MiniMax、智谱等国内厂商发布了自己的大模型，GPT-5.3 Codex与Opus 4.6也先后亮相，两种发布风格其实挺有意思。

在硅谷，OpenAI或Anthropic还习惯于扮演科技时代的预言者，他们的每一次更新都透着一种试图定义文明走向的宏大叙事感；而在国内，以阿里Qwen为典型代表，更像是一种极其务实且凶猛的工业扩张，满眼都是怎么让AI应用到具体场景。

聊到应用，当然就到了中国企业的舒适区，这也是为何春节AI大战，众多应用被推到台前，与以往不同的是，过去是有了模型，摸索能做什么应用，现在是应用场景的需求反过来去推动模型的发展。

在AI大航海时代，只有那些更聪明的船长，那些能以更低能耗航行更远距离的船只，才能最终抵达前人未至的新大陆。

变“小”的千问，怎么还变强了？

过去两年，硅谷乃至全球的AI共识一直笼罩在Scaling Law的既定路基下，更多的算力、更大的参数、更多的数据，等于更好的大模型。

但这种“大干快上”的扩张正在撞上两堵无形的墙，一堵是Transformer架构随序列长度增加而呈平方级爆炸的计算复杂度，另一堵则是让无数企业望而却步的推理成本。

这很容易让人联想到CPU时代的安迪-比尔定理（Andy and Bill’ s Law），硬件提升的性能，迅速被更吃资源的软件消耗殆尽，在大模型时代，架构迭代和算法优化释放出的算力红利，被参数量的通胀和上下文长度的堆叠耗殆尽。

如果这件事注定无法避免，那么千问3.5就让每一丝算力都能发挥出更大的价值。

传统的Transformer架构虽然强大，但它在处理超长文本时极其“重”，每多读一行字，内存和算力的负担就成倍增加。

为了打破这个僵局，业界曾尝试过各种路径，比如稀疏注意力、线性注意力、状态空间模型等，但往往陷入“性能提升则精度下降”的二律背反，要么保住效率，牺牲精度；要么保住性能，成本依旧高昂；要么提出全新架构，却难以融入现有大模型体系。

千问3.5走出了一条“大道至简”的道路，其性能跃升的背后，是对Transformer经典架构的重大创新突破。千问团队自研的门控技术成果，曾斩获全球AI顶会2025 NeurIPS最佳论文。

这不是一篇理论性质的论文，该前沿技术已融入到千问3.5创新的混合架构中去，团队结合线性注意力机制与稀疏混合专家MoE模型架构，实现了397B总参数激活仅17B的极致模型效率。

如果用通俗的话来理解，它并不提前裁剪信息，而是在注意力计算真正发生之前，引入一个可学习的“门控”（Gated Attention），先对信息做一次动态评估，再决定哪些部分用完整算力精算，哪些部分用更低成本处理。

从架构层面看，它还补上了MoE长期存在的一块短板。过去的MoE虽然已经实现了参数层面的稀疏激活，但注意力计算本身依然是全量执行，真正最重的那部分开销并没有被触动。

Gated Attention则把“是否值得计算”这件事直接前移到了注意力内部，让注意力本身也具备了可选择计算路径的能力。这意味着稀疏化第一次不只是发生在前馈网络阶段，而是深入到了Transformer最核心的计算单元里。

也正因为如此，它能够同时做到过去行业很难兼得的三件事：推理更快、成本更低，同时性能上限不受损。

原生多模态，牵一发而动全身

在当前的大模型赛道上，多模态已经成为新的焦点，但大多数现有方案仍停留在“模态叠罗汉、参数堆积”的老路上，试图把图像、文本、视频、表格等各种模态直接拼在一起，再用海量参数去支撑这种叠加，以求在Benchmark上刷出亮眼成绩。

然而，这种方式存在明显的局限，智力水平受限，推理效率低下，原因也很简单，每增加一个模态，计算量和内存需求呈指数级上升，模型的大脑被迫同时激活更多部分，但推理能力却没有成比例提升。

千问3.5是千问系列首个原生多模态模型，性能超过上一代旗舰模型——万亿参数的Qwen3-Max，但参数量却不到其40%，这背后的技术突破，值得深挖。

原生多模态的难点，在于让模型同时理解不同类型信息、建立模态间逻辑，并高效推理。

文字、图像、视频、音频各自的表达方式差异巨大，要在同一空间中理解它们的关系，本身就是技术挑战。更棘手的是跨模态对齐，图像与文字、视频与字幕、图表与说明的逻辑对应，如果处理不好，模型就可能“睁眼瞎”。

数据稀缺和训练成本也是瓶颈。高质量多模态标注难得，训练中，图像编码器、视频序列处理器和跨模态注意力层让算力消耗大，梯度易不稳，推理效率低下。

长上下文、多轮推理等任务，更要求模型动态调度注意力与算力，否则消耗呈指数级增长而理解能力提升有限。总之，简单堆模态或扩参数无法解决这一核心瓶颈。

如前所述，千问3.5的技术创新紧密耦合且相互增强，门控注意力让模型在处理长文本和多模态信息时能按需分配算力，保持推理效率与智力上限；线性注意力与稀疏MoE架构进一步降低长上下文的计算成本，让超大模型在实际使用中也能高效运行；原生多模态训练则为模型张开“眼睛”，让文字、图像、视频等信息在同一个认知空间里自然融合，同时强化推理、任务规划和空间理解能力。

这些创新并非孤立存在：高效的计算架构保证了多模态训练可行，跨模态能力反过来又推动注意力机制的优化，推理效率和认知能力相辅相成。

正因为如此，千问3.5才能在文本理解、视觉分析、视频理解、Agent执行、代码生成等多维任务中表现均衡而突出，形成一套完整的、可落地的智能体系。

千问3.5在MMLU-Pro认知能力评测中得分87.8分，超越GPT-5.2；在博士级难题GPQA测评中斩获88.4分，高于Claude 4.5；在指令遵循IFBench以76.5分刷新所有模型纪录；而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中，千问3.5表现均超越Gemini 3 Pro。

原生多模态训练，也带来千问3.5的视觉能力飞跃：在多模态推理（MathVison）、通用视觉问答VQA（RealWorldQA）、文本识别和文件理解（CC_OCR）、空间智能（RefCOCO-avg）、视频理解（MLVU）等众多权威评测中，千问3.5均斩获最佳性能。

大模型时代，阿里的阳谋

技术层面的紧耦合，其实是战略意志的体现，阿里巴巴的芯片、大模型，云基础设施等，最终是要为阿里巴巴的未来价值而服务。

就像云计算时代决定格局的不是CPU主频，而是虚拟化技术；移动互联网时代决定格局的不是带宽峰值，而是分发效率；到了大模型时代，真正决定应用爆发速度的，也不会是模型规模，更可能是每一次推理被调用的成本。

阿里巴巴比更多人更早更深刻地看到了这一点，自此出发，就能理解阿里巴巴的全盘布局。

在应用层面，1月15日，千问App发布全球首个消费级AI购物Agent。春节活动期间，全国超过1.3亿人第一次体验AI购物，说了50亿次“千问帮我”，千问一跃成为国民级AI助手。在全球首次实现大规模真实世界任务执行和商业化验证。

作为千问App的基座模型，千问3.5的Agent能力也大幅增强，实现了从Agent框架到Agent应用的新突破，可自主操作手机与电脑，高效完成日常任务，在移动端支持更多主流APP与指令，在PC端可处理更复杂的多步骤操作，如跨应用数据整理、自动化流程执行等，显著提升操作效率。

同时，千问团队构建了一个可扩展的Agent异步强化学习框架，端到端可加速3到5倍，并将基于插件的智能体Agent支持扩展至百万级规模，将进一步打开大模型在工作和生活中帮人办事的想象空间。

另一方面，阿里不仅持续推出SOTA级模型，同时通过开源开放策略，让任何人都能免费使用。这使千问迅速成为全球最受欢迎的开源模型，也为创新提供了肥沃土壤，激发了大量新的应用与创意。

目前，千问模型的开源数量超400个，衍生模型数量突破20万个，下载量突破10亿次，远超美国的Llama，包括李飞飞团队、爱彼迎等全球公司和机构都在使用千问模型。

规模化必然导致边际成本的降低，这是阿里云基础设施的强项。依托阿里云与平头哥自研芯片的支持，千问的推理效率得以进一步提升，更好满足企业级应用需求。模型、芯片与云端资源的深度耦合，实现了“1+1+1>3”的协同效应，不仅充分释放了芯片算力潜力和集群效率，也显著提高了模型训练与推理的整体性能。

例如，真武芯片针对以Qwen3为代表的主流MoE架构模型做了大量优化，可满足千问大模型对大规模计算的需求。得益于模型、芯片以及云的协同创新，千问3.5的价格进一步探底，API每百万Token输入低至0.8元，是同等性能Gemini-3-pro的1/18。

这样的策略不仅让千问在企业端备受欢迎，也让阿里云再次进入高速增长期。沙利文数据显示，千问在中国企业级大模型调用市场中位居第一，并成为阿里云新增需求的主要驱动力，带动计算、存储及数据库等基础资源消耗的增长。

根据市场调研机构Omdia数据，2025年第三季度，中国大陆云基础设施服务市场规模达到134亿美元，同比增长24%，市场已连续第二个季度实现20%以上的同比增长，阿里云在中国云基础设施服务市场的份额则提升至36%，AI相关收入已连续九个季度实现三位数同比增长，继续保持市场领先地位且优势进一步扩大。

千问3.5这一轮技术跃迁的价值，更像是阿里巴巴一场早有预期的“阳谋”，不只是把性能做上去，当长上下文、多轮推理、Agent工作流开始变成默认配置时，模型才会真正变成这个时代的基础设施，技术与商业在这里协同，算力与认知在这里形成闭环。

在大模型时代，阿里玩的是一盘既看得见的技术棋，又布局深远的商业棋。

（作者｜张帅，编辑｜盖虹达）

来源:https://www.163.com/dy/article/KM02E3BI05118O92.html

上一篇：宇树科技王兴兴：2026年机器人出货目标1-2万台

下一篇：禾赛科技：宇树两款机器人全面搭载JT128激光雷达

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

国内首批智能体国标发布，AI应用从验证迈向规模化

国内首批智能体国标发布，AI应用从验证迈向规模化

国内首批智能体国家标准正式发布，这一消息在人工智能领域引发广泛关注。简单来说，这份标准为智能体技术确立了 "定义 "，明确了分类体系、技术指标与测试方法，相当于为整个行业制定了统一规范。这意味着什么？这意味着智能体技术将告别 "野蛮生长 "，迎来标准化发展，加速其在工业制造、智慧服务、智能家居等场景的落地应

时间：2026-07-06 12:30

微星40周年限量游戏本开售 5090+96GB 55999元起

微星40周年限量游戏本开售 5090+96GB 55999元起

值得关注的是，微星在成立40周年之际，特别推出了限量典藏版机型——泰坦18 Ultra龙魂典藏版2026款游戏本，已于昨日零点正式开售，官方定价为55999元。此外，部分地区还可叠加国家补贴，实际到手价可低至54499元。作为40周年专属纪念款，其外观设计自然独具匠心。机身正面采用金属蚀刻与阳极氧

时间：2026-07-06 12:30

墨刀原型强调交互高保真真机演示，产品流程从草图到协作评审

墨刀原型强调交互高保真真机演示，产品流程从草图到协作评审

原型工具究竟在解决什么问题？这个问题其实很值得探讨。不少人听到“原型设计”，第一反应往往是绘制几张静态页面、添加几个页面跳转链接，但实际的产品流程远比这复杂。墨刀在“墨刀原型”的官方说明中，将重心放在原型设计、交互、高保真和真机演示这几个核心能力上。换句话说，它并不满足于让团队只输出页面静态图，而是

时间：2026-07-06 12:30

保时捷Taycan最后两款旅行车宣告停产

保时捷Taycan最后两款旅行车宣告停产

保时捷正式为两款纯电旅行车系列画上终止符。据海外汽车媒体motor1报道，Taycan Sport Turismo与Taycan Cross Turismo已经停止生产。随着2027款全新纯电Taycan的推出，这两款衍生车型将从产品阵容中完全移除。保时捷官方确认，此次停产的根本原因非常明确——实际

时间：2026-07-06 12:30

墨刀白板助力市场洞察需求梳理，多工具看板服务产品评审共创

墨刀白板助力市场洞察需求梳理，多工具看板服务产品评审共创

首先提出一个关键判断：在产品经理的工作流程中，原型工具通常是最为熟悉的环节。此次，墨刀将“墨刀白板”功能的定位明确聚焦在市场洞察、产品规划与需求梳理三大领域——即进入具体原型设计之前的上游协作空间。与原型工具不同，白板不侧重页面与交互细节。它更适合承载早期“发散—整理—讨论—共创—评审”的过程。简

时间：2026-07-06 12:30

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

小猫咪大城市新手攻略与全流程通关指南

社群传Bitget控告KOL 官方辟谣并无此事

全球使命3新版本零号枢纽上线盛夏好福利

暗黑破坏神4神话赫拉迪姆封印最高品质获取攻略

三角洲行动二零二六年七月七日每日密码

暗黑4 S14法师火墙流BD攻略核心装备与技能详解

暗黑4过图卡顿解决方法内存优化与设置调整

火线战姬艾希顶级阵容搭配最强推荐指南

无悔华夏宋金势力玩法角色历史背景全解析

迷你世界2026年7月7日最新激活码

小猫咪大城市新手攻略与全流程通关指南

社群传Bitget控告KOL 官方辟谣并无此事

全球使命3新版本零号枢纽上线盛夏好福利

暗黑破坏神4神话赫拉迪姆封印最高品质获取攻略

三角洲行动二零二六年七月七日每日密码

暗黑4 S14法师火墙流BD攻略核心装备与技能详解

暗黑4过图卡顿解决方法内存优化与设置调整

火线战姬艾希顶级阵容搭配最强推荐指南

无悔华夏宋金势力玩法角色历史背景全解析

迷你世界2026年7月7日最新激活码

小猫咪大城市新手攻略与全流程通关指南

社群传Bitget控告KOL 官方辟谣并无此事

全球使命3新版本零号枢纽上线盛夏好福利

暗黑破坏神4神话赫拉迪姆封印最高品质获取攻略

三角洲行动二零二六年七月七日每日密码

暗黑4 S14法师火墙流BD攻略核心装备与技能详解

暗黑4过图卡顿解决方法内存优化与设置调整

火线战姬艾希顶级阵容搭配最强推荐指南

无悔华夏宋金势力玩法角色历史背景全解析

迷你世界2026年7月7日最新激活码

相关攻略

相关攻略

国内首批智能体国标发布，AI应用从验证迈向规模化

2026-07-06 12:30

国内首批智能体国标发布，AI应用从验证迈向规模化

微星40周年限量游戏本开售 5090+96GB 55999元起

2026-07-06 12:30

微星40周年限量游戏本开售 5090+96GB 55999元起

墨刀原型强调交互高保真真机演示，产品流程从草图到协作评审

2026-07-06 12:30

墨刀原型强调交互高保真真机演示，产品流程从草图到协作评审

保时捷Taycan最后两款旅行车宣告停产

2026-07-06 12:30

保时捷Taycan最后两款旅行车宣告停产

墨刀白板助力市场洞察需求梳理，多工具看板服务产品评审共创

2026-07-06 12:30

墨刀白板助力市场洞察需求梳理，多工具看板服务产品评审共创

墨刀AI覆盖原型与PRD方案，加速产品团队想法到文档

2026-07-06 12:30

墨刀AI覆盖原型与PRD方案，加速产品团队想法到文档

学习平板销量销售额双降作业帮份额领跑

2026-07-06 12:29

学习平板销量销售额双降作业帮份额领跑

红魔游戏平板5 Pro搭载1227立体双扬声器6月30日发布

2026-07-06 12:29

红魔游戏平板5 Pro搭载1227立体双扬声器6月30日发布

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

王者荣耀世界晶珀兑换英雄推荐指南

王者荣耀世界晶珀兑换英雄推荐指南发布于 2026-07-07

王者荣耀世界西施高效培养攻略

王者荣耀世界西施高效培养攻略发布于 2026-07-07

洛克王国世界兽花蕾搭配技巧详解

洛克王国世界兽花蕾搭配技巧详解发布于 2026-07-07

宝可梦冠军机制最新变化汇总与详细解析

宝可梦冠军机制最新变化汇总与详细解析发布于 2026-07-07

我要当老祖限时首领高伤打法技巧攻略

我要当老祖限时首领高伤打法技巧攻略发布于 2026-07-06

龙腾世纪3审判物品复制方法轻松获取珍稀装备

龙腾世纪3审判物品复制方法轻松获取珍稀装备发布于 2026-07-06

玩转游戏法则，轻松掌握核心技巧与策略

玩转游戏法则，轻松掌握核心技巧与策略发布于 2026-07-06

龙腾世纪3审判捏脸技巧打造惊艳女性角色

龙腾世纪3审判捏脸技巧打造惊艳女性角色发布于 2026-07-06

Mac如何关闭聚焦搜索的翻译功能

Mac如何关闭聚焦搜索的翻译功能发布于 2026-07-07

Win10系统内置屏幕录制工具的完整开启方法与步骤详解

Win10系统内置屏幕录制工具的完整开启方法与步骤详解发布于 2026-07-07

Mac电脑如何关闭Dock栏应用缩放动画

Mac电脑如何关闭Dock栏应用缩放动画发布于 2026-07-07

Win11音量调节按钮灰色无法响应的解决方法

Win11音量调节按钮灰色无法响应的解决方法发布于 2026-07-07

内存条标签频率参数代表什么含义

内存条标签频率参数代表什么含义发布于 2026-07-07

荣耀v30语音助手权限开启教程

荣耀v30语音助手权限开启教程发布于 2026-07-07

奔驰纯电GLC城市通勤表现实测解析

奔驰纯电GLC城市通勤表现实测解析发布于 2026-07-07

通勤平价降噪耳机推荐哪些值得选

通勤平价降噪耳机推荐哪些值得选发布于 2026-07-07

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集