当前位置: 首页
科技数码
阿里千问Qwen3-Max推理模型发布:旗舰版性能详解

阿里千问Qwen3-Max推理模型发布:旗舰版性能详解

热心网友 时间:2026-01-27
转载

据智通财经App了解,1月26日,阿里旗下千问系列旗舰推理模型Qwen3-Max-Thinking正式亮相。据悉,Qwen3-Max-Thinking在事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力等多个关键维度上均实现了显著提升。在19项权威基准测试中,其性能已能媲美GPT-5.2-Thinking、Claude-Opus-4.5及Gemini 3 Pro等顶尖模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

此次推出的Qwen3-Max-Thinking引入了两项核心创新技术:

(1) 自适应工具调用能力,该系统能够按需调用搜索引擎和代码解释器等工具,该能力现已上线Qwen Chat;

(2) 测试时扩展技术,该技术显著提升了模型的推理性能,使其在关键推理基准上超越了Gemini 3 Pro。


更全面的评估分数如下表所示:


自适应工具调用能力

与以往需要用户手动选择工具的方式不同,Qwen3-Max-Thinking能够在对话中自主选择并调用其内置的搜索、记忆和代码解释器功能。这一能力源于专门设计的训练流程:在完成初步的工具使用微调后,模型在多样化任务上结合规则与模型反馈进行了进一步训练。实践证明,搜索和记忆工具能有效缓解幻觉问题、提供实时信息访问并支持更个性化的回复。代码解释器则允许用户执行代码片段,并应用计算推理来解决复杂问题。这些功能共同构成了流畅且强大的对话体验。

测试时扩展技术

测试时扩展指的是在推理阶段分配额外计算资源以提升模型性能的技术。我们提出了一种经验积累式、多轮迭代的测试时扩展策略。不同于简单地增加并行推理路径数量(这往往导致冗余推理),我们限制并将节省的计算资源用于由“经验提炼”机制引导的迭代式自我反思。该机制从过往推理轮次中提炼关键洞见,使模型避免重复推导已知结论,转而聚焦于未解决的不确定性。关键在于,相比直接引用原始推理轨迹,该机制实现了更高的上下文利用效率,能在相同上下文窗口内更充分地融合历史信息。在总体token消耗大致相同的情况下,该方法在多个基准上持续优于标准的并行采样与聚合方法,例如GPQA(90.3 → 92.8)、HLE(34.1 → 36.5)、LiveCodeBench v6(88.0 → 91.4)、IMO-AnswerBench(89.5 → 91.5)以及HLE(w/ tools)(55.8 → 58.3)。

Qwen3-Max-Thinking现已上线Qwen Chat,用户可直接与模型及其自适应工具调用功能进行交互。同时,Qwen3-Max-Thinking的API也已开放。

来源:https://www.163.com/dy/article/KK9Q887T05198UNI.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Meta AI培训周启动,高强度推动全员深度掌握AI工具

Meta AI培训周启动,高强度推动全员深度掌握AI工具

据《商业内幕》报道,Meta近期集中举办“AI转型周”活动,通过黑客马拉松、产品演示和实验项目等形式,要求各层级员工展示借助AI工具完成的工作成果。活动重点演示AI智能体在电脑与手机间的协同操作,目

时间:2026-03-28 16:46
情感交互机器人“爱洵”首秀:眨眼卖萌懂人心的秘密

情感交互机器人“爱洵”首秀:眨眼卖萌懂人心的秘密

3月27日,2026成都首届“村糖会”高新分会场在铁像寺水街启动。其间,一位特殊的“探展嘉宾”成为观众焦点——情感陪伴人形机器人“爱湫”穿梭于各个摊位,时而与非遗摊主互动问候,时而向市民游客眨眼卖萌

时间:2026-03-28 16:46
三诺携双引擎亮相广东联通生态大会:AI梦工厂共建湾区智创新生态

三诺携双引擎亮相广东联通生态大会:AI梦工厂共建湾区智创新生态

3月27日,以“向实同行,行稳致远”为主题的广东联通2026年数智创新暨合作伙伴大会在广州举办。作为联通整合算力、技术、终端、服务全产业链资源的年度重磅盛会,本次大会聚焦数智生活升级、产业生态共建与

时间:2026-03-28 16:04
Molili 1.1.0发布:升级微信生态,成本减半的重大更新

Molili 1.1.0发布:升级微信生态,成本减半的重大更新

3月27日,国内首个 OpenClaw 中文版 Molili 正式带来1 1 0版本重磅更新。本次升级以 “打通全场景、降低使用门槛、严控使用成本” 为核心,不仅原生接入微信最新机器人,实现远程指令

时间:2026-03-28 16:04
知行汽车2025年营收10亿目标挑战:同比降20%与4.16亿亏损

知行汽车2025年营收10亿目标挑战:同比降20%与4.16亿亏损

3月28日消息,知行汽车科技(苏州)股份有限公司(简称:“知行汽车”,股份代号:1274)日前发布截至2025年12月31日的财报。财报显示,知行汽车2025年营收为10亿元,较上年同期的12 47

时间:2026-03-28 16:04
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程