当前位置: 首页
科技数码
阿里深夜发布最强千问推理模型,性能比肩GPT-5.2

阿里深夜发布最强千问推理模型,性能比肩GPT-5.2

热心网友 时间:2026-01-27
转载

阿里系模型攻坚提速。1月26日晚,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下多项权威评测全球新纪录,性能媲美GPT-5.2、Gemini+3+Pro,成为迄今为止最接近国际顶尖模型的国内最强AI大模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据了解,Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T+Tokens。此前,预览版Qwen3-Max-Thinking斩获数学推理AIME+25和HMMT+25的国内首个双满分,推理性能已令人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能:在覆盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了多项最佳表现(SOTA)纪录,整体性能可媲美+GPT-5.2-Thinking-xhigh、Claude+Opus+4.5+和+Gemini+3+Pro+。

据悉,在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time+Scaling)机制,使得推理性能提升的同时还更经济。

目前业界普遍在推理时会遇到以下难题:只会简单增加并行推理路径,重复推导已知结论,造成冗余推理效率低下。据悉,千问采用新机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,获得更智能的推理结果。基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5-Thinking的45.5、Gemini+3+Pro的45.8,录得当前所有模型的最高分。

HLE测试中千问得分58.3,超过GPT-5.2-Thinking。

另外,面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言,在完成初步的工具使用微调后,通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。这种自适应的工具调用能力可在QwenChat上完整体验,模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。据了解,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。

采写:南都N视频记者+林文琪

来源:https://www.163.com/dy/article/KK91FIDB05129QAF.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
商用机器人炒菜普及率超94%,距离家宴美味还有几道坎?

商用机器人炒菜普及率超94%,距离家宴美味还有几道坎?

3月11日,方太正式发布了方太全球首款机器人厨房。 这款烹饪机器人厨房,搭载业界首套“成长型”厨房具身智能系统。 高精度机械臂能够精准完成餐具取放、接水、洗碗机餐具摆放等精细动作;而人形机器人则

时间:2026-03-28 18:04
美团小象西南首店启幕:成华三大消费助力春启新程

美团小象西南首店启幕:成华三大消费助力春启新程

00:57封面新闻记者 易弋力3月27日,美团小象超市西南开城仪式在成都万象城举办,春启成华三新促消费活动正式启动。联动全区商家、特色首店的成华消费场景上新月也同步进行中。尝鲜赏春正当时,从成华出发

时间:2026-03-28 17:04
京东物流第13架货机投用,渝长三角次晨达再加密

京东物流第13架货机投用,渝长三角次晨达再加密

IT之家 3 月 28 日消息,3 月 27 日,京东物流旗下第 13 架全货机在重庆投用运营,并同步开通重庆 = 芜湖全货机航线。IT之家从最新介绍获悉,京东物流此次投用的 B738 货机满载吨位

时间:2026-03-28 17:04
AI违规致案件激增5倍:擅删邮件与滥用成隐患

AI违规致案件激增5倍:擅删邮件与滥用成隐患

IT之家 3 月 28 日消息,英国卫报昨日(3 月 27 日)发布博文,报道称由英国政府资助的一项最新研究显示,过去六个月内,AI 聊天机器人违抗人类指令、实施欺骗的真实案例激增五倍,总数近 70

时间:2026-03-28 17:04
吉利银河L7竖向大屏版更新Flyme Auto 2系统

吉利银河L7竖向大屏版更新Flyme Auto 2系统

IT之家 3 月 28 日消息,吉利公布银河 L7 最新更新内容,银河 Flyme Auto 2 智能座舱系统竖屏版全国 OTA 于 3 月 26 日起分批推送。IT之家整理如下:地图升级:新增巡航

时间:2026-03-28 17:04
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程