数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI

阿里通义千问Qwen3.7实测评测国产大模型破解奥赛难题与图文识别

阿里通义千问Qwen3.7实测评测国产大模型破解奥赛难题与图文识别

热心网友时间：2026-05-20

转载

今天，阿里通义千问的Qwen3.7系列预览版模型正式上线，包括Max和Plus两个版本。大模型竞技场（Arena.ai）也同步公布了Qwen3.7-Max-Preview的评测成绩。在覆盖主流基座模型的总榜上，这款模型位列第13名，正好卡在GPT 5.5和Grok 4.2之间，是目前榜单上排名最高的国产模型。

具体到细分领域，它的表现同样可圈可点：在数学榜单上排名第7，在专家任务和软件与信息技术任务中均位列第9，编程任务则排在第10。

▲ Arena.ai公布的Qwen3.7-Max-Preview成绩

至于Qwen3.7-Plus-Preview，其总榜排名尚未公布。不过，在竞技场的视觉排行榜上，已经能看到它的身影——排名第16，得分介于GPT 5.4和Gemini-3 Flash之间。

目前，阿里方面尚未披露Qwen3.7系列的具体技术细节。有消息称，在明天的阿里云峰会上，这两款模型的更多信息可能会被揭晓。

现在，用户已经可以通过Qwen Studio抢先体验这两款模型。它们目前以闭源模式发布，其中Qwen3.7-Max-Preview仅支持推理模式，暂不支持图片上传功能。

我们第一时间对两款模型进行了实测。针对Qwen3.7-Max-Preview，测试涵盖了数学、编程、推理等多种任务类型；而对Qwen3.7-Plus-Preview的考察，则主要集中在视觉能力上。

从实际体验来看，这一代Qwen模型的响应速度更快、表达更直接，思考节奏也比前代模型显得更为果断。尤其在编程和视觉理解方面，能力的提升是能够被清晰感知到的。

一、4分钟解出IMO难题，还能写个能跑的EXE

在多个细分领域的排名中，Qwen3.7-Max-Preview的数学得分尤为突出。为了验证这一点，我们直接搬出了2025年国际数学奥林匹克（IMO）的一道难题来考它。

模型拿到题目后，进行了多轮分析和反复核验，最终给出了正确答案。整个过程耗时大约4分钟，思考速度相当不错。

目前Qwen只提供思维链总结，无法看到模型完整的思考过程。但从总结中可以发现，与之前的版本相比，Qwen3.7-Max-Preview似乎“自信”了不少，反复自我核查的环节有所减少。

它在编程任务上的表现也值得一看。不过，由于目前模型只能在网页端体验，我们暂时没有尝试过于复杂的开发任务。

第一个编程任务是让它生成一个番茄钟桌面应用，并直接打包成EXE文件。Qwen3.7-Max-Preview没有在思考环节过多停留，而是迅速投入开发，设计了一个具备工作计时、短休息、长休息、自动切换、声音提醒和任务统计功能的应用。

模型坦言无法直接输出EXE文件，但提供了详细的打包指引。按照指引操作后，应用虽然成功打包，但首次运行时却无法正常启动。

在阅读了报错信息后，Qwen3.7-Max-Preview判断问题出在Tkinter底层（Tcl/Tk）在打包后不支持带透明度的十六进制颜色代码上。

修复这个问题后，桌面应用终于可以正常运行了，核心功能一切正常，只是界面设计略显粗糙。

用HTML输出内容近来成了AI圈的热点。于是，我们让Qwen3.7-Max-Preview设计一份AI社交媒体应用的产品需求文档，并要求直接输出为HTML网页。

接到任务后，它没有先输出文字版再转换，而是直接用HTML输出了全部内容。从结果看，这份产品需求文档结构完整，甚至还配上了产品原型设计。不过，在产品功能定义上似乎有些“大而全”，导致焦点不够突出。

我们还测试了其他类型的任务。在SVG图绘制上，Qwen3.7-Max-Preview顺利生成了一张动态的“鹈鹕骑自行车”图片，画面内容基本准确。

在通用推理任务中，它一眼就看穿了这道“海龟汤”谜题的答案，判断出女孩是红绿色盲，并且很可能不是父亲的亲生女儿。

二、有惊无险攻克视觉版“洗车店难题”，凭一张图复刻微信界面

接下来的测试，重点考察Qwen3.7-Plus-Preview的视觉能力。

第一个任务是道进阶版的“洗车店难题”。我们使用AI生成了一张卫星地图风格的图片，图中仅标注了两个地点之间的距离。

我们告诉模型，左侧地点是“我家”，右侧是“洗车店”，然后提问：如果要去洗车，应该走路还是开车？

从它的思考过程可以看出，模型准确地识别了图片中的文字和视觉信息，并评估了各种选项。有趣的是，在某个思考阶段，它甚至得出了“走路才是最合理高效方式”的结论，险些“掉坑”。

不过，它最终给出了正确答案：开车去洗车，然后走路回家，这样就不用浪费时间在店里干等。

此前在实测其他多模态模型时我们发现，如今的模型在“看图猜地点”上表现不俗。这次也让Qwen3.7-Plus-Preview试了试同样的题目。

看到图片后，模型首先通过建筑风格判断此处位于中国北方某大型城市，然后依据山脉形态推断远处的山属于燕山余脉。最终，它认为远处的山是军都山，并由此推测观察点位于昌平南邵。

这个判断其实是错的，但离正确答案已经非常接近。图中的山脉实际上是北京的凤凰岭，而观察地位于马池口镇，模型的猜测与实际地点相距不到10公里。

视觉能力还能与编程结合。我们随手截了一张微信的界面图，要求模型复刻出一个类似的网页版聊天工具。

执行过程中，尽管图片里没有明显的“微信”字样，但Qwen3.7-Plus-Preview通过UI风格等视觉元素，准确判断出这是微信，并据此规划了设计风格。

从最终的复刻效果来看，模型很好地把握了微信的设计特点，外观还原度相当高。当然，图中的按钮目前还无法实际点击使用。

结语：Qwen系列进入加速迭代期

今年以来，阿里Qwen系列模型的迭代速度明显加快。从2026年2月至今，阿里已经陆续发布了Qwen3.5、Qwen3.6、Qwen3.7三代模型。相比之下，整个2025年，Qwen主要只发布了Qwen3和Qwen-Next两个大版本。

这种变化意味着，Qwen正在从过去以“大版本发布”为核心的节奏，转向一种更敏捷的开发模式。通过高频的预览版发布和能力增量更新，模型得以更快地进入真实场景接受检验，技术路线的演进也显得更加清晰和持续。

来源:https://www.163.com/dy/article/KTAVSN90051180F7.html

上一篇：魏牌V9X混动MPV上市 34.98万元起搭载智能驾驶大模型

下一篇：基于真实对话的模型性能评估实践 ShareGPT数据集Benchmark方法详解

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

阿里通义千问Qwen3.7实测评测国产大模型破解奥赛难题与图文识别

阿里通义千问Qwen3.7实测评测国产大模型破解奥赛难题与图文识别

阿里发布Qwen3 7系列预览版模型。Qwen3 7-Max-Preview在大模型竞技场总榜位列第13，为当前国产模型最高排名，在数学等细分榜单表现突出。实测显示，该模型响应更快，在数学推理、编程及视觉任务上能力提升明显，能解答奥赛难题并生成应用。Qwen3 7-Plus-Preview在视觉榜单排名第16，展现出较强的图像理解与界面复刻能力。系列模型正转

时间：2026-05-20 08:26

魏牌V9X混动MPV上市 34.98万元起搭载智能驾驶大模型

魏牌V9X混动MPV上市 34.98万元起搭载智能驾驶大模型

魏牌V9X上市，定位中大型SUV，售价34 98万起。新车基于归元S平台打造，全系标配2 0T混动系统，续航达1700公里。搭载超级智慧底盘、双VLA大模型架构及智慧大灯，车身采用高强度材料，配备多层防护电池包与高标准主动安全系统。

时间：2026-05-20 08:25

腾势N9闪充版正式上市硬核实力与快充技术定义豪华SUV新标杆

腾势N9闪充版正式上市硬核实力与快充技术定义豪华SUV新标杆

腾势N9闪充版上市，售价40 98万起。搭载第四代闪充架构，常温5分钟补能300公里，极寒充电仅12分钟。依托超6000座闪充站网络，配备智能底盘与高强度车身，安全性获顶级评价。智能系统集成车载大模型，实现全场景智驾与感知座舱，以技术突破重塑高端SUV价值标准。

时间：2026-05-20 08:25

英伟达13F文件揭示AI投资新方向从GPU转向瓶颈资产布局

英伟达13F文件揭示AI投资新方向从GPU转向瓶颈资产布局

英伟达最新持仓报告显示AI投资趋势正从GPU硬件转向高效交付与价值转化环节，其投资组合涵盖算力运营、光通信及AI制药等领域，致力于构建“AI工厂”生态系统。这表明AI基础设施瓶颈已转向算力部署、网络连接与高价值应用，资本将聚焦尚未被充分定价的瓶颈资产。

时间：2026-05-20 08:25

AI浪潮驱动MLCC需求增长行业迎来新一轮上行周期

AI浪潮驱动MLCC需求增长行业迎来新一轮上行周期

当前，全球人工智能技术浪潮正深刻重塑硬件基础设施，产业链各环节均面临价值重估。其中，作为电子电路基础被动元件的MLCC（片式多层陶瓷电容器），其战略重要性日益凸显，正迎来新一轮产业成长周期。中信证券近期发布深度报告，系统剖析了其背后的核心驱动逻辑与投资机遇。 AI服务器与高压快充：驱动MLCC需求双

时间：2026-05-20 08:25

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

日榜
周榜
月榜

明末渊虚之羽望山村女眷支线任务攻略

原神哥伦比娅配队思路与阵容搭配推荐

火焰审判手游职业解析指南与选择推荐

天羽传奇职业选择指南与全职业介绍

白金撒花成就解锁攻略与获取方法详解

中世纪建筑结构稳定性解析与建造技巧

童话师墙后装饰摆放技巧与布置方法

造梦西游4手游邮件系统使用与查看方法

三角洲行动怦然心动效果调整方法详解

王者荣耀世界共鸣系统玩法详解与实战技巧

洛克王国星之路位置与前往方法详解

洛克王国龙须小径位置与前往路线详解

洛克王国家园解锁方法详细步骤指南

洛克王国水晶神殿进入方法及问题解决

洛克王国吹笛子动作使用教程

我的世界基岩版自定义NPC制作与召唤指令教程

洛克王国雷电迷踪活动地图位置详解

光与影远征队布料获取与衣物制作材料教程

洛克王国钓鱼馆位置与前往路线详解

像素火影网页版正版免费入口官方在线畅玩地址

《问剑长生》新大区预创角开启，是什么福利让玩家直呼夯爆了？

紧急！Axios 被投毒，3亿项目受到影响！教你怎么自查！

兆易创新2025年年营收92亿元，净利16亿元

TensorFlow - AI开发平台,AI开发框架

解决sql server2008注册表写入失败，vs2013核心功能安装失败

《九牧之野》S3乱世诡道主题服开启：4月18日上线，预备盟奖励与开服福利一文看懂

donk：对待季军赛的心态和决赛不一样，总之已经拿不到冠军了

iPhone 15耳机连接后音量小原因排查与解决

蛮荒领主手游测试资格获取方式蛮荒领主内测资格申请渠道与条件详解

极狐S3预告发布：三电可选、宽体运动设计，2026北京车展亮相

相关攻略

相关攻略

《炎龙骑士团2》详细全攻略

2015-03-10 11:25

《炎龙骑士团2》详细全攻略

《东吴霸王传2013》详细全关攻略

2015-03-10 11:05

《东吴霸王传2013》详细全关攻略

《臭作》之100%全完整攻略

2021-08-04 13:30

《臭作》之100%全完整攻略

《兰斯8》剧情攻略详细篇

2015-03-10 11:22

《兰斯8》剧情攻略详细篇

《英雄坛说》详细全攻略

2015-03-10 12:39

《英雄坛说》详细全攻略

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

2022-05-16 18:57

《造梦西游2：十殿阎罗篇》BOSS档案及掉落装备全介绍及攻略

偷窃少女的教育方法全攻略

2025-05-23 13:43

偷窃少女的教育方法全攻略

无法抵挡小恶魔的诱惑攻略

2025-05-23 14:01

无法抵挡小恶魔的诱惑攻略

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

异人之下手游安卓版正式上线时间与开服日期公布

异人之下手游安卓版正式上线时间与开服日期公布发布于 2026-05-20

炉石传说狂野模式30号角骑卡组代码与实战指南

炉石传说狂野模式30号角骑卡组代码与实战指南发布于 2026-05-20

炉石传说狂野模式40龙德卡组代码与玩法攻略

炉石传说狂野模式40龙德卡组代码与玩法攻略发布于 2026-05-20

异人之下手游什么时候上线具体公测时间公布

异人之下手游什么时候上线具体公测时间公布发布于 2026-05-20

全民萌兽最强宠物排行榜单推荐

全民萌兽最强宠物排行榜单推荐发布于 2026-05-20

异人之下手游全角色图鉴：技能详解与强度排行

异人之下手游全角色图鉴：技能详解与强度排行发布于 2026-05-20

洛克王国星辰守护者暮光性格选择攻略

洛克王国星辰守护者暮光性格选择攻略发布于 2026-05-20

洛克王国雅丹鬃性格选择与技能搭配攻略

洛克王国雅丹鬃性格选择与技能搭配攻略发布于 2026-05-20

CAC 2026前瞻：中国战队本土作战迎强敌

CAC 2026前瞻：中国战队本土作战迎强敌发布于 2026-05-20

俯视动作冒险游戏Elementallis将于4月29日正式发售

俯视动作冒险游戏Elementallis将于4月29日正式发售发布于 2026-05-20

饥困荒野官网预约地址及游戏入口获取指南

饥困荒野官网预约地址及游戏入口获取指南发布于 2026-05-20

洛克王国世界里奥进化攻略与形态详解

洛克王国世界里奥进化攻略与形态详解发布于 2026-05-20

Necrophosis完全意识版5月28日正式发售

Necrophosis完全意识版5月28日正式发售发布于 2026-05-20

三国志战略版机关神兵队阵容搭配攻略

三国志战略版机关神兵队阵容搭配攻略发布于 2026-05-20

云之国击岩采石场全收集攻略视频流程详解

云之国击岩采石场全收集攻略视频流程详解发布于 2026-05-20

和平精英2026新春版本评测：值得体验的春节玩法与更新内容

和平精英2026新春版本评测：值得体验的春节玩法与更新内容发布于 2026-05-20

Windows批量修改文件创建与修改时间属性强制更改教程

Windows批量修改文件创建与修改时间属性强制更改教程发布于 2026-05-19

Windows 11彻底关闭建议内容和设置页面广告教程

Windows 11彻底关闭建议内容和设置页面广告教程发布于 2026-05-19

Ansible AWX安装配置教程 Linux自动化运维平台搭建指南

Ansible AWX安装配置教程 Linux自动化运维平台搭建指南发布于 2026-05-19

Win11查看内存双通道运行状态与效率检测指南

Win11查看内存双通道运行状态与效率检测指南发布于 2026-05-19

Linux系统位数查询方法快速判断32位或64位

Linux系统位数查询方法快速判断32位或64位发布于 2026-05-19

麒麟系统开启高性能模式教程提升运行速度与流畅度

麒麟系统开启高性能模式教程提升运行速度与流畅度发布于 2026-05-19

Mac磁盘工具无法修复错误的解决方法与维护指南

Mac磁盘工具无法修复错误的解决方法与维护指南发布于 2026-05-19

Linux SSH长连接配置教程解决远程频繁掉线问题

Linux SSH长连接配置教程解决远程频繁掉线问题发布于 2026-05-19

国产内存新架构突破30TB带宽实现自主供应链

国产内存新架构突破30TB带宽实现自主供应链发布于 2026-05-11

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解

Edge浏览器网页捕获功能使用教程截取全屏与区域截图详解发布于 2026-05-11

千度手机版官网免费入口手机端专用访问链接

千度手机版官网免费入口手机端专用访问链接发布于 2026-05-11

ES文件浏览器复制文件内容到剪贴板详细步骤教程

ES文件浏览器复制文件内容到剪贴板详细步骤教程发布于 2026-05-11

如何设置鼠标连点器的固定点击间隔秒数

如何设置鼠标连点器的固定点击间隔秒数发布于 2026-05-11

苹果iPhone 15截屏保存到相册的详细步骤教程

苹果iPhone 15截屏保存到相册的详细步骤教程发布于 2026-05-11

立升净水器滤芯更换方法与使用指南

立升净水器滤芯更换方法与使用指南发布于 2026-05-11

ES文件浏览器如何设置默认打开应用详细图文教程

ES文件浏览器如何设置默认打开应用详细图文教程发布于 2026-05-11

热门话题

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

魔术游戏下载-魔术游戏-2022热门的魔术小游戏大全

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

刀塔传奇破解版在哪下-刀塔传奇破解版无限钻石下载大全-刀塔传奇破解版内购破解版合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

饥荒下载免费中文版-饥荒下载破解版-饥荒正版全部版本下载合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

拉布布游戏下载-拉布布游戏合集-拉布布系列游戏大全合集

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

洛克王国手游正版下载-洛克王国正版手游下载安装大全-类似洛克王国的手机游戏推荐

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

神魔幻想单机游戏下载-神魔幻想单机游戏推荐-神魔幻想系列游戏下载合集

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

最受女生欢迎的游戏_女生玩的手游_思美人手游下载专区

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

疯狂越野系列游戏下载_疯狂越野全版本合集中文版下载

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集

神庙逃亡2破解无限金币无限钻石下载-神庙逃亡2国际版破解大全-神庙逃亡2版本合集