蚂蚁开源Ring-2.5:首个万亿参数混合线性架构思考模型
2月13日,蚂蚁集团百灵大模型团队正式发布了首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T,并宣布开源。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,作为迈向通用智能时代的关键一步,研发团队将混合线性注意力架构在预训练和强化学习阶段均进行了大规模扩展。一方面,团队通过高效的1:7 MLA结合Lightning Linear Attention架构,显著提升了模型的思考效率与探索空间;另一方面,借助扩展强化学习与智能体环境规模,进一步增强了模型的思考深度与长程执行能力。
与先前发布的Ring-1T相比,Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升:
高效生成:得益于高比例线性注意力机制,当生成长度超过32K时,模型显存占用降低超过10倍,生成吞吐量提升3倍以上,特别适合需要深度思考与长程执行的任务场景。
深度思考:在RLVR基础上引入密集奖励机制,通过反馈思考过程的严谨性,使Ring-2.5-1T在IMO 2025和CMO 2025两项国际数学竞赛中均达到金牌水平。
长程执行:通过大规模全异步智能体强化学习训练,模型在复杂任务的长程自主执行能力得到显著提升,使得Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

为评估Ring-2.5-1T的深度思考与长程执行能力,团队选取了具有代表性的开源思考模型和闭源API作为参照基准。
Ring-2.5-1T在数学、代码、逻辑等高难度推理任务和智能体搜索、软件工程、工具调用等长程任务执行上均达到开源领先水平。
团队还额外测试了深度思考模式,通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在IMO 2025中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025中取得105分,显著高于金牌线及国家集训队入选线。
此外,Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式,将Ling 2.0架构的GQA升级为1:7的MLA结合Lightning Linear结构。具体而言,团队基于此前发布的Ring-flash-linear-2.0技术路线,将部分GQA层改造为Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache,将其余GQA层近似转换为MLA,并对其中的QK Norm、Partial RoPE等特性进行了针对性适配,以增强Ling 2.5架构在混合注意力架构下的表达能力。

改造后,Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显。


不过,蚂蚁集团也提到,这一版本模型在token效率与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。
模型发布地址如下:
Hugging Face
ModelScope
Ling Studio与ZenMux的Ring-2.5-1T Chat体验页面和API服务将在近期上线。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公
新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而
OpenClaw漏洞威胁:智能家居被反锁与隐私泄露风险
新智元报道编辑:倾倾【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「
华为大模型负责人离职,重大人事变动引发行业关注
智东西作者|江宇编辑|冰倩智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。在
Nature重磅:AI生成论文在顶会通过率55%,单篇成本仅15美元
新智元报道编辑:元宇【新智元导读】刚刚,Nature盖章AI独立科研时代!全新Scaling Law显现,人类死守的学术铁王座,正发生不可逆的转移。一篇长达数十页的学术论文,在人类设定研究主题和实验
CMU首创无毒AutoGEO方案,破解GEO投毒产业链焦虑
新智元报道编辑:LRST【新智元导读】ChatGPT上线广告、315曝光GEO投毒产业链,AI搜索商业化的隐忧接连浮出水面。龙虾热背后,3000元就能让AI搜索信口开河,离全面「瞎说」还有多远?来自
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

