当前位置: 首页
科技数码
阿里千问Qwen3-Max推理模型发布:旗舰版性能详解

阿里千问Qwen3-Max推理模型发布:旗舰版性能详解

热心网友 时间:2026-01-27
转载

据智通财经App了解,1月26日,阿里旗下千问系列旗舰推理模型Qwen3-Max-Thinking正式亮相。据悉,Qwen3-Max-Thinking在事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力等多个关键维度上均实现了显著提升。在19项权威基准测试中,其性能已能媲美GPT-5.2-Thinking、Claude-Opus-4.5及Gemini 3 Pro等顶尖模型。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

此次推出的Qwen3-Max-Thinking引入了两项核心创新技术:

(1) 自适应工具调用能力,该系统能够按需调用搜索引擎和代码解释器等工具,该能力现已上线Qwen Chat;

(2) 测试时扩展技术,该技术显著提升了模型的推理性能,使其在关键推理基准上超越了Gemini 3 Pro。


更全面的评估分数如下表所示:


自适应工具调用能力

与以往需要用户手动选择工具的方式不同,Qwen3-Max-Thinking能够在对话中自主选择并调用其内置的搜索、记忆和代码解释器功能。这一能力源于专门设计的训练流程:在完成初步的工具使用微调后,模型在多样化任务上结合规则与模型反馈进行了进一步训练。实践证明,搜索和记忆工具能有效缓解幻觉问题、提供实时信息访问并支持更个性化的回复。代码解释器则允许用户执行代码片段,并应用计算推理来解决复杂问题。这些功能共同构成了流畅且强大的对话体验。

测试时扩展技术

测试时扩展指的是在推理阶段分配额外计算资源以提升模型性能的技术。我们提出了一种经验积累式、多轮迭代的测试时扩展策略。不同于简单地增加并行推理路径数量(这往往导致冗余推理),我们限制并将节省的计算资源用于由“经验提炼”机制引导的迭代式自我反思。该机制从过往推理轮次中提炼关键洞见,使模型避免重复推导已知结论,转而聚焦于未解决的不确定性。关键在于,相比直接引用原始推理轨迹,该机制实现了更高的上下文利用效率,能在相同上下文窗口内更充分地融合历史信息。在总体token消耗大致相同的情况下,该方法在多个基准上持续优于标准的并行采样与聚合方法,例如GPQA(90.3 → 92.8)、HLE(34.1 → 36.5)、LiveCodeBench v6(88.0 → 91.4)、IMO-AnswerBench(89.5 → 91.5)以及HLE(w/ tools)(55.8 → 58.3)。

Qwen3-Max-Thinking现已上线Qwen Chat,用户可直接与模型及其自适应工具调用功能进行交互。同时,Qwen3-Max-Thinking的API也已开放。

来源:https://www.163.com/dy/article/KK9Q887T05198UNI.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
汉王数字文具新品发布引领办公新潮流

汉王数字文具新品发布引领办公新潮流

汉王科技发布AI数字文具录写本M6,集录音、记事、阅读功能于一体,面向全球专业人士。该产品打通信息输入到知识产出的全场景闭环,顺应AI时代智能硬件功能全面、生态开放的趋势,突破传统电纸书赛道,推动其向集成化、多场景的“数字文具”新阶段迈进。

时间:2026-05-14 14:07
手机AI应用创作指南:近半数用户移动端完成灵珠设计

手机AI应用创作指南:近半数用户移动端完成灵珠设计

灵珠平台数据显示,近半数用户通过手机进行AI创作,其中创业者与媒体从业者移动端使用率最高。平台用户增长迅速,已升级模型并优化移动体验。不同背景用户均能快速创建应用,表明低门槛AI创作需求广泛,移动端正成为重要生产工具。

时间:2026-05-14 14:06
谷歌安卓用户赔偿申请指南 135亿美元和解金如何领取

谷歌安卓用户赔偿申请指南 135亿美元和解金如何领取

谷歌同意支付1 35亿美元和解一桩集体诉讼。该诉讼指控安卓系统未经用户同意通过移动网络传输数据,甚至在设备闲置时仍持续收集。和解方案已获法院批准,符合条件的美国安卓用户可提交赔偿申请。赔偿总额在扣除相关费用后,将由最多约1亿名符合条件的用户分配。

时间:2026-05-14 14:05
河南4.89亿元医疗AI示范项目开标 人工智能平台建设启动

河南4.89亿元医疗AI示范项目开标 人工智能平台建设启动

河南省医疗人工智能平台项目公布中标结果,河南智能医学科技有限公司以约4 89亿元成为第一候选人。该项目聚焦中医药领域,计划构建涵盖数据、算力、开发与运营的完整生态,建设多层级医疗数据集,研发行业垂直模型,并在诊断、治疗等五大方向开展15个场景应用验证。中标方以联合体形式整。

时间:2026-05-14 14:04
比亚迪特斯拉等十余家车企悄然涨价告别价格战

比亚迪特斯拉等十余家车企悄然涨价告别价格战

近期多家新能源车企释放调价信号,部分车型直接涨价或缩减终端优惠。比亚迪、长安启源、小米SU7及特斯拉ModelY等车型价格均有上调,蔚来、小鹏等品牌也计划跟进。此外,部分车企收紧了金融免息政策,消费者实际购车成本有所增加。

时间:2026-05-14 14:03
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程