阿里千问登顶全球冠军,空间推理能力超越Gemini3与GPT5
11月26日,业界领先的空间推理基准测试榜单SpatialBench发布了最新一期成绩,阿里千问的视觉理解模型Qwen3-VL与Qwen2.5-VL包揽冠亚军,综合表现超越了Gemini 3、GPT-5.1、Claude Sonnet 4.5等国际顶尖模型。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
SpatialBench榜单数据显示,Qwen3-VL-235B与Qwen2.5-VL-72B分别取得13.5和12.9的高分,显著领先于Gemini 3.0 Pro Preview(9.6分)、GPT-5.1(7.5分)及Claude Sonnet 4.5等海外旗舰模型。

不过需要指出的是,当前AI大模型的整体表现与人类水平仍存在差距,人类基准线约为80分左右。在电路分析、CAD工程设计和分子生物学等复杂空间推理任务中,专业人士依然保持着明显优势,现有大模型还无法完全自动化完成此类工作。
据了解,Qwen2.5-VL于2024年开源,而Qwen3-VL则是阿里在2025年推出的新一代视觉理解模型。
Qwen3-VL在视觉感知与多模态推理方面取得重要突破,在32项核心能力测评中超越了Gemini 2.5 Pro和GPT-5。它不仅能够调用截图、搜索等工具完成"带图推理"任务,还能凭借一张设计草图或一段游戏视频直接进行"视觉编程"。

同时,Qwen3-VL专门增强了3D检测能力,能够更精准地感知空间环境。基于该模型,机器人可以更好地判断物体方位、视角变化和遮挡关系,实现如同远处采摘苹果般精准的动作控制。
目前Qwen3-VL已开源多个版本,包括2B、4B、8B、32B等密集模型,以及30B-A3B、235B-A22B等MoE架构模型。每个模型都提供指令版和推理版两种选择,成为目前最受企业和开发者欢迎的开源视觉理解模型。此外,Qwen3-VL模型也已上线千问APP,用户可免费体验其强大功能。
据悉,SpatialBench是近年来兴起的第三方空间推理基准测试榜单,主要关注多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为衡量"具身智能"发展水平的新兴测试标准之一。
SpatialBench不仅测试模型已有知识,更着重评估模型在二维和三维空间中感知和操控抽象概念的能力,这对具身智能的实际落地应用尤为关键。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
华为畅享90 Pro Max红外传感器详解:影像设计与对称美学融合
IT之家 3 月 29 日消息,在 3 月 23 日的华为春季全场景新品发布会上,华为畅享 90 系列手机正式发布。而随着畅享系列的回归,华为终端 BG 首席执行官何刚宣布,华为手机实现全面回归。华
蔚来萤火虫11个月交付5万辆,刷新里程碑
IT之家 3 月 29 日消息,蔚来 firefly 萤火虫品牌最新微博今日宣布里程碑再度刷新:自 2025 年 4 月 29 日开启首批交付以来,历时 11 个月,正式达成 5 万台交付。IT之家
2026中关村论坛年会:摩尔线程携全栈自研算力方案亮相AI展区
北京商报讯(记者 王蔓蕾)2026中关村论坛年会期间,北京商报记者在现场了解到,国产全功能GPU企业摩尔线程携全栈自主算力解决方案亮相 "人工智能+ "展区。在 "人工智能+ "展区,摩尔线程集中展示了全栈
灵伴科技周军:AI眼镜如何赋能残障群体平等生活
本报(chinatimes net cn)记者石文君 北京报道3月27日,由中国残联、北京市政府主办,北京市残联承办的2026中关村论坛年会科技助残论坛在北京举行。此次论坛以“科技有爱共创美好世界”
脑机接口赋能残障人士:科技如何将科学构想变为现实
北京智冉医疗科技有限公司研发的高通量可拉伸柔性电极本报(chinatimes net cn)记者李氏琼 王晓慧 北京报道曾经的科学构想正逐步转化为可见的现实——在2026年中关村论坛年会常设展上,参
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

