当前位置: 首页
AI资讯
阿里千问3.7编程能力全球第二仅次于Claude

阿里千问3.7编程能力全球第二仅次于Claude

热心网友 时间:2026-05-27
转载

5月26日凌晨,全球权威的第三方编程能力盲测榜单Code Arena公布了最新排名。阿里云最新发布的旗舰模型Qwen3.7-Max以1541分的优异成绩,一举超越了GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等众多强劲对手,在全球大模型厂商中位列第二,仅次于Claude系列。这一里程碑式的成就表明,在代码生成与理解这一核心AI赛道上,千问3.7-Max已成功跻身全球顶尖行列。

图说:Code Arena最新榜单显示,阿里凭借Qwen3.7-Max位列全球第二

编程能力已成为评估大模型智能水平的关键指标。Code Arena作为知名大模型盲测平台LMArena旗下最具公信力的榜单之一,其评测机制与传统基准测试大不相同。它不考核孤立的代码片段或经典算法题,而是由真实开发者出题,要求模型从零开始构建一个完整、可交互的Web应用程序。最终,由用户对匿名模型的生成效果进行两两盲测投票,综合得出排名。这种高度贴近“实战”的评测方式,使Code Arena被广泛视为目前全球最具参考价值的AI编程能力排行榜。

经过全球开发者基于真实项目体验的盲测投票,千问3.7模型的编程能力稳居前四,打破了此前由Claude-Opus-4.7和4.6长期主导的竞争格局。尤为突出的是,Qwen3.7-Max是目前榜单中唯一突破1540分大关的国产大模型,展现了国产AI技术的强劲实力。

此次取得突破的Qwen3.7-Max,是专为智能体(Agent)场景深度优化的模型。它在代码编程、智能体协作、长程复杂任务规划与执行等核心能力上实现了显著跃升。据官方披露,该模型能在数小时内独立完成通常需要专业团队两周时间的复杂项目,实现端到端的全流程交付,这将极大推动企业级办公自动化与生产力变革。其能力边界甚至拓展至更极致的场景:可持续运行长达35小时,累计进行超1000次工具调用,以完成如自我编程优化芯片内核这类高度复杂的超长程任务。

模型发布后,迅速在全球开发者社区与业界引发热烈反响。众多独立开发者、AI创作者及企业用户第一时间在社交媒体分享了测评体验。普遍反馈认为,其“长程自主执行与复杂问题解决能力令人印象深刻”,堪称“真正能闭环完成任务的大模型智能体基座”。有AI研究机构在相同提示词下对Qwen3.7-Max、Claude-4.7与GPT-5.5进行了横向对比,结果显示千问3.7相比其上一代模型性能提升幅度最大,同时在推理成本上更具优势。在代码生成速度与输出质量这两个关键维度上,相较其他主流模型也展现出明显的竞争力。

来源:阿里云。

来源:https://www.bestblogs.dev/article/60d3d012?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
科技七巨头困境已过 其他板块将面临滚动熊市冲击

科技七巨头困境已过 其他板块将面临滚动熊市冲击

华尔街分析师TomLee认为,科技七巨头已走出困境,AI需求将支撑市场韧性。但其他板块如中小盘股、高负债企业可能面临熊市风险,主要受高利率、IPO解禁及能源短缺三大威胁影响。市场将呈现分化态势,半导体与AI领域或持续强势,而其余部分可能承压。

时间:2026-05-27 21:05
提升对话分享价值与可读性的实用操作指南

提升对话分享价值与可读性的实用操作指南

分享ChatGPT对话时,是不是总觉得生成的ShareGPT链接内容有些散乱,重点不够突出,别人看起来也费劲?这往往是因为原始对话缺少了结构化的梳理和信息聚焦。想让你的分享既专业又易懂,不妨试试下面这五个步骤。 一、精简对话上下文,保留核心问答对 对话轮次太多,关键信息反而容易被淹没,看的人得费老大

时间:2026-05-27 21:05
可重构芯片如何成为人工智能的理想解决方案

可重构芯片如何成为人工智能的理想解决方案

可重构芯片通过多层次动态重构能力,适配多样化的神经网络结构,高效处理稀疏数据并支持混合精度计算,显著提升硬件利用率和能效,是应对AI算法快速演进的关键技术。

时间:2026-05-27 21:04
Kimi实时搜索健康饮食科研报告最新成果

Kimi实时搜索健康饮食科研报告最新成果

《2026中国儿童生长与消化健康白皮书》于今年5月15日正式发布。这份报告具有重要的参考价值,是国内首部同时关注儿童消化系统健康与骨骼发育的权威科普白皮书。报告基于全国多中心监测数据,揭示了一个亟待关注的现状:我国3至11岁儿童的每日钙摄入量,平均仅达到膳食推荐摄入量的30%至40%。报告强调,消化

时间:2026-05-27 21:04
上海交大高金非全日制金融硕士项目招生启动

上海交大高金非全日制金融硕士项目招生启动

上海高级金融学院推出全新非全日制金融硕士项目,聚焦跨境金融、AI+金融及金融基础设施创新三大方向,依托交大学科优势,构建金融与科技深度融合的培养体系。项目采用双导师制与实战模式,强调真实场景实践,致力于培养具备全球视野、科技理解力与解决复杂问题能力的复合型人才,以。

时间:2026-05-27 21:03
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程