阿里通义千问Qwen3-Max问世,数学推理满分的AI模型超越GPT5

阿里发布重磅AI模型Qwen3-Max 剑指行业前三
9月24日,2025云栖大会正式开幕。会上阿里正式发布了通义千问旗舰级大模型Qwen3-Max,其综合性能表现超越GPT5和Claude Opus 4等国际竞品,成功挺进全球AI大模型第一阵营。
双版本并行 全球排名亮眼
Qwen3-Max创新性地推出"指令(Instruct)"和"推理(Thinking)"两个专项版本。目前预览版已在国际权威AI评测平台Chatbot Arena位列第三,预计正式版将带来更多性能突破。
万亿级参数的王者实力
作为通义千问系列目前最强的基座模型,Qwen3-Max展现了令人瞩目的技术实力:
- 训练数据达36万亿token量级
- 总参数量突破万亿大关
- 编程能力和智能体工具调用能力突出
在国际编程能力测试SWE-Bench Verified中,Qwen3-Max Instruct版以69.6的高分进入全球第一梯队;而在智能体工具调用测试Tau2-Bench中更是创下74.8分的记录,领先Claude Opus4和DeepSeek-V3.1等强劲对手。
推理能力获重大突破
Qwen3-Max的强化版Qwen3-Max-Thinking-Heavy在并行推理技术的加持下表现惊艳:
- 数学推理测试AIME 25和中国高中数学联赛(HMMT)双满分
- 开创业内首个100分纪录
- 首创代码求解+工具调用的解题模式
该模型的卓越表现源于两项关键技术突破:首先是在解题过程中灵活调用计算工具的能力,其次是充分利用了计算资源的扩展优势。
全栈产品矩阵正式成型
通义千问系列已完成从5亿到超万亿参数的全尺寸布局,包含300余款细分模型,覆盖各类应用场景。即日起用户可通过以下途径体验:
- QwenChat免费试用Qwen3-Max
- 阿里云百炼平台调用API服务
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
全球新能源汽车销量突破4000万大关,中国领跑市场
梁文锋在《自然》发表封面论文中国杭州AI初创公司DeepSeek开发的R1模型近日在《自然》杂志发表了同行评议版本,成为首个经过严格学术审查的主要大语言模型。DeepSeek 创始人兼CEO梁文峰为
小米SU7召回11.7万辆,修复辅助驾驶安全隐患
国家市场监督管理总局缺陷产品召回技术中心近日发布公告,小米汽车科技有限公司依据《缺陷汽车产品召回管理条例》要求,启动对部分Xiaomi SU7标准版电动汽车的召回计划,涉及车辆总数达116,887辆
阿里联手英伟达开启深度合作,加速AI产业布局
人工智能攻关“揭榜挂帅” 加速AI+制造专项行动从工业和信息化部获悉,我国将启动新一轮人工智能赋能新型工业化“揭榜挂帅”行动。新一轮人工智能赋能新型工业化“揭榜挂帅”希望通过机制创新,在新型工业化重
桂林理工陨石研究团队入选广西青创空间建设名单
近日,共青团广西壮族自治区委员会正式发布了第四批“广西青创空间”建设集体名单。其中,桂林理工大学地球科学学院夏志鹏教授领衔的“陨石与行星物质研究”团队凭借突出表现成功入选,成为自治区内行星科学领域的
科创50ETF涨1.74% 半导体设备股盛美上海创新高
今日盘面显示,上证科创板50成份指数(代码:000688)表现强劲,截至上午10时21分涨幅达1 74%。成分股中,盛美上海(688082)以9 99%的涨幅领涨,股价创下历史新高;华海清科(688
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















