当前位置: 首页
AI
蚂蚁开源Ring-2.5:首个万亿参数混合线性架构思考模型

蚂蚁开源Ring-2.5:首个万亿参数混合线性架构思考模型

热心网友 时间:2026-02-13
转载

2月13日,蚂蚁集团百灵大模型团队正式发布了首个采用混合线性架构的万亿参数思考模型——Ring-2.5-1T,并宣布开源。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据介绍,作为迈向通用智能时代的关键一步,研发团队将混合线性注意力架构在预训练和强化学习阶段均进行了大规模扩展。一方面,团队通过高效的1:7 MLA结合Lightning Linear Attention架构,显著提升了模型的思考效率与探索空间;另一方面,借助扩展强化学习与智能体环境规模,进一步增强了模型的思考深度与长程执行能力。

与先前发布的Ring-1T相比,Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升:

高效生成:得益于高比例线性注意力机制,当生成长度超过32K时,模型显存占用降低超过10倍,生成吞吐量提升3倍以上,特别适合需要深度思考与长程执行的任务场景。

深度思考:在RLVR基础上引入密集奖励机制,通过反馈思考过程的严谨性,使Ring-2.5-1T在IMO 2025和CMO 2025两项国际数学竞赛中均达到金牌水平。

长程执行:通过大规模全异步智能体强化学习训练,模型在复杂任务的长程自主执行能力得到显著提升,使得Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。

蚂蚁集团开源Ring-2.5-1T:首个混合线性架构万亿参数思考模型

为评估Ring-2.5-1T的深度思考与长程执行能力,团队选取了具有代表性的开源思考模型和闭源API作为参照基准。

Ring-2.5-1T在数学、代码、逻辑等高难度推理任务和智能体搜索、软件工程、工具调用等长程任务执行上均达到开源领先水平。

团队还额外测试了深度思考模式,通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在IMO 2025中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025中取得105分,显著高于金牌线及国家集训队入选线。

此外,Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式,将Ling 2.0架构的GQA升级为1:7的MLA结合Lightning Linear结构。具体而言,团队基于此前发布的Ring-flash-linear-2.0技术路线,将部分GQA层改造为Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache,将其余GQA层近似转换为MLA,并对其中的QK Norm、Partial RoPE等特性进行了针对性适配,以增强Ling 2.5架构在混合注意力架构下的表达能力。

蚂蚁集团开源Ring-2.5-1T:首个混合线性架构万亿参数思考模型

改造后,Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显。

蚂蚁集团开源Ring-2.5-1T:首个混合线性架构万亿参数思考模型

蚂蚁集团开源Ring-2.5-1T:首个混合线性架构万亿参数思考模型

不过,蚂蚁集团也提到,这一版本模型在token效率与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。

模型发布地址如下:

Hugging Face

ModelScope

Ling Studio与ZenMux的Ring-2.5-1T Chat体验页面和API服务将在近期上线。

来源:https://tech.ifeng.com/c/8qi50HKJ3P0

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
前Meta总监田渊栋创业获谷歌英伟达投资研发自我进化AI

前Meta总监田渊栋创业获谷歌英伟达投资研发自我进化AI

前Meta FAIR研究科学家总监田渊栋近日在社交平台X上正式宣布,其创立的新公司Recursive_SI已正式亮相。这家聚焦递归超级智能的初创企业,自成立之初便备受业界瞩目。 Recursive_SI的起步堪称梦幻。公司成立仅数月,在产品尚未正式发布的情况下,便已完成超过6 5亿美元的巨额融资,估

时间:2026-05-14 17:39
Joby与Skyports合作完成纽约首批eVTOL点对点飞行

Joby与Skyports合作完成纽约首批eVTOL点对点飞行

纽约的天空,正迎来一场静悄悄的变革。就在不久前,垂直起降机场开发与运营公司Skyports Infrastructure与Joby A viation合作,在“2026电动天空之旅”纽约市飞行活动期间,完成了一系列具有里程碑意义的飞行。活动从4月23日持续至5月1日,多架次点对点的电动垂直起降(eV

时间:2026-05-14 17:38
索尼PlayStation利用AI技术革新游戏开发流程

索尼PlayStation利用AI技术革新游戏开发流程

索尼将AI定位为游戏开发的效率工具,旨在辅助而非取代人类创意。其AI工具可自动生成面部动画,大幅缩短制作时间,已应用于《地平线》等游戏。索尼强调创意核心始终在人,AI主要用于自动化重复流程、加速建模测试。公司亦探索生成式AI在视频制作中的应用,同时承认该技术在一致性与可控性上仍。

时间:2026-05-14 17:38
穆巴达拉携手Core42与Solutions+共建主权AI基础设施

穆巴达拉携手Core42与Solutions+共建主权AI基础设施

Core42与Solutions+达成战略合作,共同推进阿联酋主权AI基础设施建设。Core42提供主权云与AI算力,Solutions+负责实施与数据服务,双方构建端到端交付模式,服务于穆巴达拉集团及政府机构,确保数据驻留境内,支撑国家数字化战略与经济韧性。

时间:2026-05-14 17:37
Yum Brands技术负责人详解如何构建餐饮业AI骨干平台

Yum Brands技术负责人详解如何构建餐饮业AI骨干平台

编者按:本文内容源自CIO Dive与CX Dive于今年5月举办的线上研讨会,相关精彩内容现已开放按需回看。 谈及餐饮巨头与科技的深度融合,Yum Brands(百胜餐饮集团)无疑是行业先行者。早在三十二年前,其旗下品牌必胜客便通过PizzaNet平台,成功完成了全球首笔餐厅在线订单交易,开创了餐

时间:2026-05-14 17:36
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程