蚂蚁百灵发布开源推理模型Ring-mini-2.0,轻量级架构耗时更少

近日,百灵大模型官方公众号发布消息,蚂蚁百灵团队正式开源其最新研究成果——Ring-mini-2.0推理模型。这款基于Ling 2.0架构深度优化的MoE(专家混合)模型,在保持16B总参数量的同时,仅需激活1.4B参数就能发挥堪比10B级全参数模型的推理能力,尤其在逻辑推理、代码编写和数学运算等任务上展现出惊人实力,同时还具备128K超长上下文处理能力和每秒300+ token的生成速度。
经过Long-COT SFT训练、升级版RLVR(强化学习价值回归)以及RLHF(人类反馈强化学习)的联合调优,Ring-mini-2.0在复杂推理任务中的稳定性和泛化能力获得突破性提升。在LiveCodeBench、AIME 2025等高难度测试基准中,其性能不仅碾压同类10B规模的密集参数模型,部分指标甚至比肩更大规模的MoE模型(如gpt-oss-20B-medium),特别是在逻辑推理领域表现出色。
(Ring-mini-2.0性能表现)
技术层面,Ring-mini-2.0延续了Ling 2.0的高效MoE设计,通过1/32专家激活比和创新的MTP分层架构,仅激活1.4B参数就能实现7-8B全参模型的等效性能。其独创的小激活、高稀疏架构在H20硬件部署下可达300+ token/s的处理速度,配合Expert Dual Streaming推理优化后更能飙升至500+ token/s,显著降低了高并发场景下的推理成本。此外,借助YaRN外推技术支持的128K长文本处理能力,在长内容生成场景中可获最高7倍以上的性能加速。
蚂蚁百灵团队承诺将全面开源Ring-mini-2.0的模型权重、训练数据集及RLVR+RLHF联合训练方案。这款"小而强大"的推理模型有望成为中小规模AI应用的首选方案,为学术界和工业界提供极具价值的技术参考和实践平台。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
Nothing Phone推送OS 4.0 Beta版:新增快捷开关及实用功能
近日,Nothing公司宣布面向旗下Phone(2)、Phone(3)及Phone(2a)系列机型推送Nothing OS 4 0 Beta版本系统更新。此次升级基于安卓16底层架构开发,重点优化了
湾流G300超中型公务机发布:替代G280+升级驾驶舱
湾流宇航公司今日正式发布全新超中型公务机Gulfstream G300,该机型将接替现役的G280成为新一代旗舰产品。这款飞机融合了多项创新技术,在航程性能、客舱舒适度及航电系统方面实现突破性升级。
滴普科技IPO备案通过,年收入达2.4亿元
10月1日消息,滴普科技日前获IPO备案,滴普科技成立于2018年,是一家企业级大模型人工智能应用解决方案提供商,滴普科技股东包括高瓴资本、五源资本、IDG等投资机构。滴普科技专注于为企业提供前沿的
小米王腾离职风波:多平台账号相继注销封禁
10月1日消息,原小米中国区市场部总经理、REDMI 品牌总经理王腾于今年 9 月被小米通报辞退,通报称“泄露公司机密信息,且存在利益冲突等严重违规违纪行为”。王腾被小米辞退后,其多个平台的账号出现
波音161吨客机戈壁坠毁,500专家90天再造运-10完成首飞
新疆戈壁滩的寒风裹挟着冰碴,在1971年的冬天划出一道道凛冽的轨迹。一架波音707客机残骸歪斜地躺在零下30度的荒漠中,扭曲的金属在阳光下泛着冷光。这堆被烈火灼烧过的废墟,即将成为中国航空工业命运的
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















