当前位置: 首页
科技数码
蚂蚁开源Ring-2.5-1T:首个混合线性架构的万亿参数模型

蚂蚁开源Ring-2.5-1T:首个混合线性架构的万亿参数模型

热心网友 时间:2026-02-13
转载

IT之家2月13日消息,蚂蚁集团百灵大模型于今日正式发布并开源其首个混合线性架构的万亿参数思考模型——Ring-2.5-1T。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据介绍,作为迈向通用智能时代的关键一步,该团队在预训练与强化学习阶段对混合线性注意力架构进行了大规模扩展。一方面采用高效的1:7 MLA+Lightning Linear Attention架构,显著提升了模型的思维效率与探索空间;另一方面通过扩展强化学习与智能体环境规模,有效增强了模型的思考深度与长程执行能力。

相比此前发布的Ring-1T,Ring-2.5-1T在生成效率、思考深度和长程执行能力上均有显著提升:

高效生成:得益于高比例线性注意力机制,在超过32K生成长度场景下,显存占用降低超过10倍,吞吐量提升达3倍以上,尤其适合深度思考和长程执行任务。深度思考:在RLVR基础上引入密集奖励机制,对思考过程的严谨性进行反馈,使得Ring-2.5-1T在IMO 2025和CMO 2025测试中均达到金牌水平(自测结果)。长程执行:通过大规模全异步智能体强化学习训练,显著提升对复杂任务的长程自主执行能力,使Ring-2.5-1T能够轻松适配Claude Code等智能体编程框架和OpenClaw个人AI助手。


为评估Ring-2.5-1T的深度思考和长程执行能力,团队选取了具有代表性的开源思考模型(DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking)和闭源API(GPT-5.2-thinking-high、Gemini-3.0-Pro-preview-thinking-high、Claude-Opus-4.5-Extended-Thinking)作为参照基准。

Ring-2.5-1T在数学、代码、逻辑等高难度推理任务(IMOAnswerBench、AIME 26、HMMT 25、LiveCodeBench、ARC-AGI-V2)和智能体搜索、软件工程、工具调用等长程任务执行(Gaia2-search、Tau2-bench、SWE-Bench Verified)上均达到了开源领先水平。

团队还额外测试了深度思考模式,通过在推理过程中扩展并行思考与总结,实现测试时扩展,从而有效提升推理的深度与广度。在IMO 2025(满分42分)中,Ring-2.5-1T获得35分,达到金牌水平;在CMO 2025(满分126分)中取得105分,显著高于金牌线(78分)及国家集训队入选线(87分)。

此外,Ling 2.5架构在Ling 2.0架构基础上引入了混合线性注意力架构。通过增量训练方式,将Ling 2.0架构的GQA升级为1:7的MLA+Lightning Linear结构。具体而言,团队基于此前发布的Ring-flash-linear-2.0技术路线,将部分GQA层改造为Lightning Linear Attention,以显著提升长程推理场景下的吞吐能力。为进一步压缩KV Cache,将其余GQA层近似转换为MLA,并对其中的QK Norm、Partial RoPE等特性进行了针对性适配,以增强Ling 2.5架构在混合注意力架构下的表达能力。


改造后,Ring-2.5-1T的激活参数量从51B提升至63B。但在混合线性注意力架构的支持下,其推理效率相比Ling 2.0仍实现了大幅提升。即便与激活参数仅为32B的KIMI K2架构相比,1T规模下的Ling 2.5架构在长程推理场景下的吞吐依然具有显著优势;且生成长度越长,吞吐优势越明显。



不过,蚂蚁集团也提到,这一版本模型在token效率与指令遵循方面仍存在不足,在面向更真实、更复杂任务的长程执行与实际交付能力上,也仍有较大的优化空间。团队将在后续版本中持续改进上述能力,并非常期待来自社区的使用反馈与建议。目前,Ring-2.5-1T的训练仍在持续推进中。完整技术报告将在下一版本发布后正式公开。

IT之家附地址如下:

Hugging Face

ModelScope

Ling Studio与ZenMux的Ring-2.5-1T Chat体验页和API服务将在近期上线。

来源:https://www.163.com/dy/article/KLLD23CO0511B8LM.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
机械师推出曙光 Pro 电脑主机:搭载 14 代酷睿 CPU,10499 元起

机械师推出曙光 Pro 电脑主机:搭载 14 代酷睿 CPU,10499 元起

机械师曙光Pro电竞主机首发开售:14代酷睿+RTX 50系双芯组合,配置价格全解析 近日,机械师旗下新款曙光Pro高性能游戏主机已在京东平台正式开售。对于近期计划购置高性能整机的玩家与创作者而言,这款搭载新一代硬件组合的机型无疑提供了值得重点考量的新选择。下面我们将全面解析其核心配置与首发价格信息

时间:2026-04-04 16:14
小米官宣涨价!卢伟冰罕见回应 内存涨价扛不住了

小米官宣涨价!卢伟冰罕见回应 内存涨价扛不住了

今日,小米针对旗下部分热门在售机型发布建议零售价调整公告,此举在智能手机业内引发广泛关注与讨论。 调价详情 本次价格调整主要覆盖REDMI系列的三款主力机型,详细情况如下: REDMI K90 Pro Max官方建议零售价正式上调200元; REDMI Turbo 5与Turbo 5 Max两款机型

时间:2026-04-04 11:21
显卡安全警报!经典攻击拿捏N卡:RTX 3060/A6000等已沦陷

显卡安全警报!经典攻击拿捏N卡:RTX 3060/A6000等已沦陷

研究人员成功将经典Rowhammer攻击移植至现代GPU,引发显卡安全新挑战 显卡安全面临全新威胁:最新研究披露的GDDRHammer与GeForge攻击技术,成功利用GDDR6显存的物理缺陷发起Rowhammer攻击。这种攻击不仅能破坏GPU内部的内存隔离机制,更可进一步穿透至主机系统内存,危及整

时间:2026-04-04 11:07
iFixit 拆解苹果 AirPods Max 2 耳机,胶水仍是维修“最大敌人”

iFixit 拆解苹果 AirPods Max 2 耳机,胶水仍是维修“最大敌人”

苹果AirPods Max 2深度拆解:熟悉的配方,不变的“维修之墙” 近日,知名维修机构iFixit发布了一段备受关注的视频,他们终于对苹果新款高端头戴耳机AirPods Max 2“动了手”。拆解结果多少有些令人意外:新耳机在核心架构上,几乎就是初代产品的“复刻版”。 附上相关拆解视频如下: i

时间:2026-04-04 07:42
三星连续七年稳居全球电竞显示器市场榜首

三星连续七年稳居全球电竞显示器市场榜首

三星电子连续七年蝉联全球电竞显示器销量冠军,领跑高端游戏显示市场 三星电子在游戏显示领域的领先地位再次获得权威认证。根据国际数据公司(IDC)发布的《PC显示器季度追踪报告》显示,截至2025年,三星已连续第七年稳居全球电竞显示器品牌市场份额第一,占有率达18 9%。尤其在代表尖端显示技术的OLED

时间:2026-04-04 07:01
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程