阿里千问3.7编程能力全球第二,仅次于Claude
5月26日凌晨,全球最具公信力的第三方编程能力评测平台Code Arena公布了最新榜单。阿里云最新发布的旗舰大模型Qwen3.7-Max以1541分的优异成绩,一举超越了GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等众多强劲对手,在全球大模型厂商中排名第二,仅次于Claude系列。这一里程碑式的成绩,标志着阿里千问3.7在代码生成与理解这一核心领域,已稳居全球顶尖水平。
图说:Code Arena最新榜单显示,阿里凭借Qwen3.7-Max位列全球第二
当前,编程能力已成为评估大模型智能水平的关键指标。Code Arena榜单由知名的大模型盲测平台LMArena推出,是全球公认最具影响力的实战评测之一。其评测机制与传统代码测试截然不同:它不考核孤立的算法题,而是采用更贴近真实开发的“硬核”模式——由开发者出题,要求模型从零开始构建一个完整、可交互的Web应用程序。随后,所有匿名模型生成的作品将进行两两对决,由全球开发者根据实际使用体验进行投票,最终综合得出排名。这种“实战盲测”相结合的模式,使其被广泛视为检验AI编程能力的终极试金石。
那么,千问3.7在此次实战中的具体表现如何?经过全球开发者的匿名投票,其编程能力成功进入榜单前四。这一突破意义重大,因为它打破了此前长期由Claude-Opus-4.7和4.6主导的前四名格局。尤为值得关注的是,Qwen3.7-Max是目前榜单上唯一一个突破1540分门槛的国产大模型,这无疑是中国AI技术发展的一个重要里程碑。
此次能力突破,根植于模型本身的技术进化。专为智能体(Agent)场景深度优化的Qwen3.7-Max,在代码编程、智能体协作与复杂长程任务处理等核心维度实现了显著跃升。其能力已远超编写代码片段,能够独立完成端到端的复杂项目开发。测试表明,它能在数小时内交付一个通常需要专业开发团队耗时两周才能完成的项目,这为办公自动化与企业级生产力提升带来了巨大想象空间。更令人印象深刻的是,该模型能够持续运行超过35小时,累计进行超1000次工具调用,完成如自我编程优化芯片内核等极端复杂的长程任务,展现了卓越的任务持久性与规划能力。
Qwen3.7-Max发布后,迅速在全球开发者社区与行业内部引发热烈反响。众多独立开发者、AI创作者及企业用户第一时间在社交平台分享了测评体验。许多开发者评价其“长程自主执行能力惊人”,堪称“真正能独立完成全流程任务的智能体基座模型”。有AI研究机构在相同提示词下,对Qwen3.7-Max、Claude-4.7和GPT-5.5进行了横向对比,结果显示千问3.7相比其前代模型性能提升幅度最大,同时在推理成本上更具优势。在代码生成速度与输出质量这两个关键指标上,相较于其他主流模型也展现出强劲的竞争力。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Notion AI生成GitHub项目README文件功能详解与使用教程
利用NotionAI生成GitHub项目README需提供清晰指令并分步操作。首先构建结构化提示词模板,要求包含标题、功能、安装等六个部分。随后注入项目真实元数据确保内容准确。采用分段生成与人工校验避免格式错误,并可利用Notion公式动态更新版本号。最后导出为Markdown并验证渲染效果,确保文档专业可用。
阿里千问3.7编程能力全球第二,仅次于Claude
5月26日凌晨,全球最具公信力的第三方编程能力评测平台Code Arena公布了最新榜单。阿里云最新发布的旗舰大模型Qwen3 7-Max以1541分的优异成绩,一举超越了GPT-5 5、Gemini-3 5-Flash、GLM-5 1、Kimi-K2 6等众多强劲对手,在全球大模型厂商中排名第二,
可灵AI制作水彩晕染展开效果教程
使用可灵AI实现水彩晕染需启用“湿画法动态晕染”模式,设置纸基、湿润度等参数模拟物理特性。通过时间轴编辑器设置关键帧,精准控制晕染节奏与形态。叠加湿纸基底与液态牵引双滤镜层,可增强真实水性反应。还可利用图生视频功能,上传手绘水痕过程图作为种子帧并辅以精确指令,驱动AI生。
可灵与即梦AI电商短视频工具对比哪款更实用
选择电商短视频AI工具时,若侧重商品细节展示与质感还原,可灵AI在主体稳定性和细节渲染上表现更优;若注重运营效率、真人口播适配及多平台发布,即梦AI在分镜生成、唇形同步和平台兼容性方面更具优势。两者分别适合以“货”为核心和以“人”与场景为核心的制作需求。
Qoder性能监控面板实时查看CPU内存占用情况
Qoder内置性能监控面板需手动开启,可在IDE状态栏实时查看CPU与内存占用。同时可通过日志控制台查看详细资源统计,或结合系统工具交叉验证数据准确性。此外,支持将性能数据导出至外部监控平台,便于长期追踪与分析。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

