当前位置: 首页
科技数码
阿里开源千问3.5除夕上线:原生多模态模型超越Gemini+3 Pro

阿里开源千问3.5除夕上线:原生多模态模型超越Gemini+3 Pro

热心网友 时间:2026-02-17
转载

2月16日除夕当天,阿里巴巴开源了全新一代大模型千问Qwen3.5-Plus,其性能表现足以媲美Gemini 3 Pro。千问3.5实现了底层模型架构的全面革新,此次发布的Qwen3.5-Plus版本总参数量达到3970亿,但激活参数仅为170亿,以更少的资源实现了更强的性能,不仅超越了万亿参数的Qwen3-Max模型,还将部署显存占用降低了60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API定价极具竞争力,每百万Token低至0.8元,仅为Gemini 3 Pro的十八分之一。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据了解,与前几代千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的跨越式升级。千问3的预训练基于纯文本Tokens进行,而千问3.5则基于视觉和文本混合token进行预训练,并大幅新增中英文、多语言、STEM和推理等数据,以不足40%的参数规模获得了超万亿参数Qwen3-Max基座模型的顶尖性能:千问3.5在MMLU-Pro知识推理评测中获得87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench中以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。


图注:千问3.5推理效率大幅提升

此外,基于顶级视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。

同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3至5倍,并将插件式智能体Agent支持扩展至百万级规模。

和阿里发布与2025年9月的最强基础模型Qwen3-Max相比,通过训练稳定优化以及多token预测等系列技术,Qwen3.5性能与Qwen3-Max模型持平,并进一步提升推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

目前,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型,性能更强的旗舰模型Qwen3.5-Max不久也将发布。

最近春节档AI大战愈发激烈,不仅仅是多家AI应用通过补贴吸引用户,多个国产大模型也频频上新。

字节跳动旗下AI视频生成模型Seedance2.0凭借多模态输入、文本/图片生成电影级视频等出色能力引爆网络,吸引全球关注。马斯克转发评价Seedance 2.0相关推文,并表示:模型发展速度太快,导演贾樟柯在社交平台发文表示:“Seedance 2.0确实厉害,我准备用它做个短片。”

“目前在AI视频生成领域,Seedance可谓遥遥领先。”业内人士向记者介绍,“在技术能力上,它确实已经超过Sora和Google Veo3.1、NanoBanana,这是国产大模型第一次在真正意义上做到世界第一,具有标志性意义。”

2月14日,字节跳动宣布推出豆包大模型2.0系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在技术细节上,豆包方面披露,在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

阿里千问C端事业群总裁吴嘉披露,2月6日,阿里千问APP“春节30亿大免单”正式上线,发起奶茶攻势,请全国人民用AI一句话免费点奶茶,在阿里历史上的春节活动中投入最大。第一天的实际订单达到1500万单,是原来预计的15倍,一度火到用户无法下单,2月14日,千问启动第二波免单活动,将AI大战推向高潮。

吴嘉表示,千问做这件事的初衷,并不是为了和谁卷,从来没有想过内卷,真正想让AI融入老百姓的日常生活场景中,“这是未来一定会发生的事情。”他坚信这一波的AI应用,中国一定会走在世界的最前列,模型则会在各家之间的你追我赶中,不断往前发展。

2月12日,智谱正式上线并开源其新一代旗舰模型GLM-5,这个新模型正是此前在全球模型服务平台OpenRouter登顶热度榜首、引发圈内疯狂猜测的神秘模型“Pony Alpha”。

2月13日,MiniMax正式上线新一代文本模型MiniMax M2.5,在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%,较上一代显著提升。

2月13日,据DeepSeek最新披露,DeepSeek网页/ APP正在测试新的长文本模型结构,支持1M上下文,其API 服务不变,仍为V3.2,仅支持128K上下文。也被外界认为,DeepSeek或将在今年春节再次“炸场”发布新模型,复刻去年春节现象级轰动。

来源:https://www.163.com/dy/article/KLTT74HG0514R9P4.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状

三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状

IT之家 3 月 31 日消息,对很多人来说,晕车晕船是旅行中最常见的烦心事之一。三星悄然上线了一款名为 Hearapy 的免费应用,来解决这一令人不适的问题。该公司称,这款应用无需药物或物理缓解手

时间:2026-03-31 09:13
湖南电信与海光信息深化合作,共筑算网融合与AI新生态

湖南电信与海光信息深化合作,共筑算网融合与AI新生态

据海光信息(688041 SH)消息,近日,中国电信(601728 SH)湖南分公司2026年数智科技生态大会在长沙召开,中国电信湖南分公司与海光信息全面深化数智生态合作。根据协议,双方将聚焦智能制

时间:2026-03-31 09:13
高端纯电困局,车企如何破解盈利难题

高端纯电困局,车企如何破解盈利难题

30万元以上的高端纯电车,显然成了新能源车市的那块硬骨头。除了有换电加持的蔚来新ES8,大量被车企寄予厚望的高端明星纯电车都难逃疲软命运,典型如理想MEGA和i8,一次起火事故,直接造成销量断崖式下

时间:2026-03-31 09:13
周鸿祎自述:一人公司的真相,与想象完全不同

周鸿祎自述:一人公司的真相,与想象完全不同

快科技3月31日消息,最近OPC一人公司这个词突然走红,有人认为它是AI时代的下一个风口,也有人预测未来很多公司都会变成只有一个人的形态。但在周鸿祎看来,大家或许把OPC想得太过简单了。很多人一听到

时间:2026-03-31 09:13
特斯拉高管持续离职:客户体验及Cybercab负责人卸任

特斯拉高管持续离职:客户体验及Cybercab负责人卸任

IT之家 3 月 31 日消息,据 Electrek 报道,特斯拉再度流失两名高管。该车企客户体验产品负责人何塞 · 德尔 · 科拉尔今日宣布,在任职近八年后即将离职,加入加密货币平台 Coinba

时间:2026-03-31 09:13
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程