阿里开源千问3.5除夕上线：原生多模态模型超越Gemini+3 Pro

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

阿里开源千问3.5除夕上线：原生多模态模型超越Gemini+3 Pro

热心网友时间：2026-02-17

转载

2月16日除夕当天，阿里巴巴开源全新一代大模型千问Qwen3 5-Plus，性能媲美Gemini 3 Pro。千问3 5实现了底层模型架构的全面革新，此次发布的Qwen3 5-Plus版本总参数为3

2月16日除夕当天，阿里巴巴开源了全新一代大模型千问Qwen3.5-Plus，其性能表现足以媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新，此次发布的Qwen3.5-Plus版本总参数量达到3970亿，但激活参数仅为170亿，以更少的资源实现了更强的性能，不仅超越了万亿参数的Qwen3-Max模型，还将部署显存占用降低了60%，推理效率大幅提升，最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API定价极具竞争力，每百万Token低至0.8元，仅为Gemini 3 Pro的十八分之一。

据了解，与前几代千问大语言模型不同，千问3.5实现了从纯文本模型到原生多模态模型的跨越式升级。千问3的预训练基于纯文本Tokens进行，而千问3.5则基于视觉和文本混合token进行预训练，并大幅新增中英文、多语言、STEM和推理等数据，以不足40%的参数规模获得了超万亿参数Qwen3-Max基座模型的顶尖性能：千问3.5在MMLU-Pro知识推理评测中获得87.8分，超越GPT-5.2；在博士级难题GPQA测评中斩获88.4分，高于Claude 4.5；在指令遵循IFBench中以76.5分刷新所有模型纪录；而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中，千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后，是对Transformer经典架构的重大创新突破。

图注：千问3.5推理效率大幅提升

此外，基于顶级视觉能力，千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑，高效完成日常任务，在移动端支持更多主流APP与指令，在PC端可处理更复杂的多步骤操作，如跨应用数据整理、自动化流程执行等，显著提升操作效率。

同时，千问团队构建了一个可扩展的Agent异步强化学习框架，端到端可加速3至5倍，并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布与2025年9月的最强基础模型Qwen3-Max相比，通过训练稳定优化以及多token预测等系列技术，Qwen3.5性能与Qwen3-Max模型持平，并进一步提升推理效率：在常用的32K上下文场景中，千问3.5推理吞吐量可提升8.6倍；在256K超长上下文情况下，Qwen3.5推理吞吐量最大提升至19倍，推理效率大幅提升。

目前，千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型，性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈，不仅仅是多家AI应用通过补贴吸引用户，多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络，吸引全球关注。马斯克转发评价Seedance 2.0相关推文，并表示：模型发展速度太快，导演贾樟柯在社交平台发文表示：“Seedance 2.0确实厉害，我准备用它做个短片。”

“目前在AI视频生成领域，Seedance可谓遥遥领先。”业内人士向记者介绍，“在技术能力上，它确实已经超过Sora和Google Veo3.1、NanoBanana，这是国产大模型第一次在真正意义上做到世界第一，具有标志性意义。”

2月14日，字节跳动宣布推出豆包大模型2.0系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化，旨在更好地完成真实世界的复杂任务。

在技术细节上，豆包方面披露，在语言模型基础能力上，豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩，也超越了Gemini 3 Pro在Putnam基准测试上的表现，数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露，2月6日，阿里千问APP“春节30亿大免单”正式上线，发起奶茶攻势，请全国人民用AI一句话免费点奶茶，在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单，是原来预计的15倍，一度火到用户无法下单，2月14日，千问启动第二波免单活动，将AI大战推向高潮。

吴嘉表示，千问做这件事的初衷，并不是为了和谁卷，从来没有想过内卷，真正想让AI融入老百姓的日常生活场景中，“这是未来一定会发生的事情。”他坚信这一波的AI应用，中国一定会走在世界的最前列，模型则会在各家之间的你追我赶中，不断往前发展。

2月12日，智谱正式上线并开源其新一代旗舰模型GLM-5，这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日，MiniMax正式上线新一代文本模型MiniMax M2.5，在编程能力方面，M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%，较上一代显著提升。

2月13日，据DeepSeek最新披露，DeepSeek网页/ APP正在测试新的长文本模型结构，支持1M上下文，其API 服务不变，仍为V3.2，仅支持128K上下文。也被外界认为，DeepSeek或将在今年春节再次“炸场”发布新模型，复刻去年春节现象级轰动。

来源:https://www.163.com/dy/article/KLTT74HG0514R9P4.html

上一篇：马斯克：太阳能主导未来电力体系，加速自建光伏产能

下一篇：印度AI影响力峰会召开，探讨技术新篇章