当前位置: 首页
科技数码
蚂蚁开源Ring-1T模型:万亿参数思考逼近GPT-5

蚂蚁开源Ring-1T模型:万亿参数思考逼近GPT-5

热心网友 时间:2025-10-14
转载

10月14日凌晨,蚂蚁集团正式发布万亿参数级思考模型Ring-1T,不仅公开了完整模型权重,还同步开源了详细的训练配方。这款模型在9月底开放的预览版Ring-1T-preview基础上,继续采用大规模可验证奖励强化学习(RLVR)技术进行深度训练,有效提升了万亿基座模型的自然语言推理性能。同时通过RLHF对齐优化,模型在各类任务中的表现更为均衡稳定。

为进一步挖掘模型在复杂数学推理方面的潜力,百灵技术团队尝试将Ring-1T接入多智能体框架AWorld,使用纯自然语言推理解答IMO2025国际数学奥林匹克竞赛试题。实验结果表明,该模型仅一次尝试就成功解答出第1、3、4、5题,达到了相当于IMO银牌的水平,成为全球首个能够获得国际奥数奖项的开源AI系统。在第三次尝试解答第2题几何证明时,Ring-1T给出了接近完美的推理过程;而在众多顶尖模型纷纷失利的第6题中,其最终答案"4048"与Gemini 2.5 Pro结果一致(正确答案为2112)。作为专业思考模型,Ring-1T在通用能力方面同样表现亮眼:在"Arena-Hard V2"人类偏好对齐测试中,以81.59%的成功率位居开源模型首位,紧追GPT-5-Thinking(High)82.91%的成绩;在专业医疗问答基准HealthBench测评中,也取得了开源领域的最高分。

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

(Ring-1T与业界代表性思考模型的性能横评)

训练万亿参数级思考模型面临的核心挑战在于训练与推理阶段的精度差异问题——由于实现细节不同导致的精度不一致往往引发训练崩溃。为此,蚂蚁研发团队独创了"棒冰(icepop)"算法,通过带掩码的双向截断技术将训练-推理分布差异控制在较低水平,确保长序列、长周期训练的稳定性。针对万亿参数模型强化学习的特殊需求,团队还自主研发了高性能强化学习系统ASystem(内含已开源的高性能强化学习框架AReaL),重点优化了显存管理与权重交换机制,实现了单机显存碎片的秒级回收和权重的零冗余交换,使得大规模强化学习训练成为常态化操作。

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

(图左:GRPO训推差异随着训练成指数上升,icepop较为平稳;图右:训推差异最大值,GRPO随着训练上升非常明显,icepop维持在较低水位)

此次发布的Ring-1T继续基于Ling 2.0架构的1T基础模型进行后训练。该架构融合了高度稀疏的MoE设计、1/32的专家激活比、FP8混合精度以及MTP等先进特性,确保了训练与推理的高效性。在后训练阶段,百灵团队通过LongCoT-SFT、RLVR与RLHF多阶段协同训练,显著增强了模型在复杂推理、指令遵循和创意写作等领域的综合能力。

据百灵团队介绍,Ring-1T是其在万亿参数思考模型领域的首次探索,后续将持续优化模型性能。目前用户可通过HuggingFace、魔搭社区获取模型资源,也可通过蚂蚁百宝箱等平台进行在线体验。

蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5

截至目前,蚂蚁百灵大模型系列已累计发布18款不同规模的模型,形成了从160亿到1万亿参数的全系列产品矩阵,其中包括两款万亿级参数模型——通用大语言模型Ling-1T与思考模型Ring-1T。随着这两款重量级模型的推出,百灵大模型正式迈入2.0发展阶段。

来源:https://www.leiphone.com/category/industrynews/UyRI3zy8bX6qJ8Lf.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
DeepSeek宣布永久降价 梁文锋大幅让利远超市场预期

DeepSeek宣布永久降价 梁文锋大幅让利远超市场预期

DeepSeek宣布其Pro模型API优惠将转为永久降价,调用成本大幅降低至原价的四分之一。同时,公司正进行高达500亿元的首轮融资,创始人梁文锋个人计划出资200亿元以强化控制权。降价与巨额融资相结合,旨在降低行业门槛、构建生态,并支撑其长期开源与AGI战略,展现了公司的长期主义视野。

时间:2026-05-23 22:20
国产600公斤推力涡扇发动机首飞成功 中国心实现自研突破

国产600公斤推力涡扇发动机首飞成功 中国心实现自研突破

5月23日,搭载国产F406涡扇发动机的气象无人机首飞成功。该发动机推力600公斤级,由我国自主研制,拥有完整知识产权,实现了中小推力高端涡扇发动机的自主可控。其具备高空高速稳定运行能力,填补了国内相关技术空白,将为无人机及低空经济发展提供可靠动力支撑。

时间:2026-05-23 22:19
小米米家空调巨省电Pro大1.5匹价格降至1868元

小米米家空调巨省电Pro大1.5匹价格降至1868元

2026年3月6日,备受期待的小米米家巨省电 Pro 空调 2026 款正式上市销售。作为新品,其大1 5匹型号的官方首发定价为2499元,性价比优势显著。 恰逢京东618年中购物节,这款新上市的空调迎来了绝佳的入手时机。消费者通过叠加平台提供的促销优惠与政府发放的节能补贴,最终到手价格可以做到更具

时间:2026-05-23 22:19
国产600公斤推力涡扇发动机成功完成首次飞行

国产600公斤推力涡扇发动机成功完成首次飞行

5月23日,我国自主研制的600公斤推力级F406涡扇发动机成功完成首次飞行试验。发动机驱动气象无人机平稳飞行并安全返航,各项参数稳定。此次试飞标志着我国在中小推力高端涡扇发动机领域实现了自主可控与国产化突破,该发动机将为低空经济和无人体系提供关键动力支撑。

时间:2026-05-23 22:18
国产600公斤推力涡扇发动机首飞成功核心技术自主研制

国产600公斤推力涡扇发动机首飞成功核心技术自主研制

5月23日,我国自主研制的600公斤推力级F406涡扇发动机成功完成首次飞行试验。该发动机以双发配置驱动一架先进气象无人机,全程工作平稳,安全返航。此次试飞标志着我国在中小推力高端涡扇发动机领域实现自主可控与国产化,将为低空经济与无人体系发展提供可靠动力。

时间:2026-05-23 22:17
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程