蚂蚁开源万亿参数线性思考模型，获IMO金牌水平业界首例

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

蚂蚁开源万亿参数线性思考模型，获IMO金牌水平业界首例

热心网友时间：2026-02-13

转载

智东西
作者程茜
编辑李水青

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

智东西2月13日消息，今天，蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T。

根据最新信息，相比蚂蚁2025年10月发布的万亿级思考模型Ring-1T，Ring-2.5-1T在生成效率、推理深度和长时程任务执行能力三个关键维度上实现提升，且在长文本生成、数学推理与智能体任务执行上达到开源领先水平。

在生成效率上，Ring-2.5-1T在32K以上长文本生成场景中，对比上代模型访存规模降低至1/10，生成吞吐提升3倍以上。

在深度思考能力方面，该模型在国际数学奥林匹克竞赛（IMO 2025）和中国数学奥林匹克（CMO 2025）自测均达到金牌水平，IMO为35分、CMO为105分。

目前，该模型已经适配Claude Code等智能体框架与OpenClaw个人AI助理，支持多步规划与工具调用。

Ring-2.5-1T的模型权重与推理代码已在Hugging Face、ModelScope等主流开源平台发布，最新平台Chat体验页和API服务将在近期上线。

Hugging Face：https://huggingface.co/inclusionAI/Ring-2.5-1T

ModelScape：https://modelscope.cn/organization/inclusionAI

一、拿下多项开源SOTA，达IMO金牌水平

为了评估Ring-2.5-1T的深度思考与长时任务执行能力，蚂蚁研究人员选择了具有代表性的开源思考模型DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking和闭源API GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking作为比较。

蚂蚁集团公布的多项权威基准测试结果显示，Ring-2.5-1T在数学、编程和逻辑推理的IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2等高难度推理任务以及Agent搜索、工具调用和软件工程Gaia2-search、Tau2-bench和SWE-Bench Verified等长时任务执行方面均实现了最先进的开源性能。

此外，蚂蚁还对深度思考（Heavy Thinking）模式下的模型性能进行了额外测试，Ring-2.5-1T在IMOAnswerBench、HMMT-25等数学竞赛推理基准和LiveCodeBench-v6代码生成基准中超越所有对比模型。

其中，在IMO 2025（满分42分）中，Ring-2.5-1T获得35分，达到金牌水平；在CMO 2025（满分126分）中，该模型获得105分，超过金牌分数线78分和国家队集训队选拔线87分。

研究人员比较了Ring-2.5-1T和Ring-1T的答案发现，前者在推理逻辑的严谨性、高级数学证明技术的应用以及答案表述的完整性方面均有提升。

在智能体搜索任务Gaia2-search中，Ring-2.5-1T在开源模型中取得了SOTA性能。Gaia2环境强调跨应用工具协作和复杂任务执行能力，Ring-2.5-1T在规划生成和多步工具调用方面均展现出较高的效率和准确性。

二、三大关键维度提升，能快速适配Claude Code、OpenClaw

相比蚂蚁2025年10月发布的万亿级思考模型Ring-1T，Ring-2.5-1T在生成效率、推理深度和长时程任务执行能力三个关键维度上有显著改进。

首先在生成效率方面，通过采用高比例线性注意力机制，Ring-2.5-1T将内存访问开销降低至1/10，并将超过32K token序列的生成吞吐量提高了3倍以上，适用于深度思考和长时程任务执行。

其次在深度思考层面，该模型在RLVR（基于可验证奖励的强化学习）基础上引入密集奖励机制，为推理过程提供严格性反馈，使Ring-2.5-1T同时达到IMO 2025和CMO 2025（自测）的金奖水平。

最后是长程任务执行，Ring-2.5-1T通过大规模完全异步智能体RL（强化学习）训练，增强了解决复杂任务的长时程自主执行能力，使其能快速适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

三、引入混合线性注意力架构，可提升长程推理场景吞吐量

Ring-2.5-1T基于Ling 2.5架构，通过优化注意力机制，可提升长文本推理的效率与稳定性。

作为实现自主模型架构的关键进展，Ling 2.5架构在Ling 2.0架构的基础上引入了一种混合线性注意力架构。通过增量训练，研究人员将Ling 2.0架构中的GQA（分组查询注意力）升级为MLA（多头线性注意力）+Lightning Linear结构的1:7比例。