当前位置: 首页
AI资讯
蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级

蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级

热心网友 时间:2026-05-20
转载

5月15日,蚂蚁百灵正式开源其旗舰级思考模型Ring-2.6-1T,相关权重文件已在Hugging Face和ModelScope两大主流开源平台同步发布。事实上,该模型此前已率先登陆OpenRouter平台,并开放了限时免费的API接口供开发者体验,引发了广泛的技术尝鲜与讨论。

蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强

此次开源的Ring-2.6-1T模型,其核心设计理念聚焦于“按需思考”,引入了名为“Reasoning Effort”的可调节推理强度机制,提供high与xhigh两档模式。这一创新设计允许开发者根据任务的实际复杂度与性能需求,动态调配模型的计算资源。具体而言,high模式优化了高频Agent工作流的执行效率,特别适用于多轮对话、工具调用及任务拆解等日常应用场景;而xhigh模式则全力释放模型的深度推理潜能,专为应对数学竞赛、复杂科研分析等高难度挑战而设计。这一差异化能力设计,被业界视为不仅是技术能力的突破,更是工程实用化道路上的一次重要跨越。

评测表现:两档模式,各显神通

那么,这套可调节推理机制的实际性能表现如何?根据多项权威基准评测数据,两种模式展现出清晰的差异化优势,覆盖了从高效执行到深度推理的全场景需求。

在high模式下,Ring-2.6-1T展现了卓越的Agent场景执行能力。其在评估智能体工作流性能的PinchBench上获得87.60分,表现优于GPT-5.4的xHigh模式及Gemini-3.1-Pro的high模式;在电信领域任务基准Tau2-Bench Telecom中,更取得了95.32的高分。这些成绩充分证明,该模型在处理需要快速、精准执行复杂指令链的场景中,已具备强大的竞争力。

当切换至xhigh模式,模型则转向攻坚克难。在AIME 26数学竞赛级别测试中,其得分高达95.83,已逼近多家头部闭源模型的顶尖水平;在考察深度科学知识与复杂逻辑推理的GPQA Diamond基准测试中,也获得了88.27的稳健分数。两档模式的精准定位,有效覆盖了从日常高效执行到极限深度思考的完整能力频谱。

训练基石:异步架构与“棒冰算法”

强大性能的背后,离不开创新训练方法的坚实支撑。Ring-2.6-1T采用了一套先进的异步强化学习训练架构。该架构的关键在于将策略采样与模型参数更新这两个核心步骤解耦,形成独立的处理流水线。此举有效解决了传统同步训练中常见的GPU资源闲置与等待问题,从而大幅提升了整体训练吞吐量,并为开展更长时间周期的稳定持续训练奠定了基础。

此外,百灵团队还将此前在Ring-1T模型中验证有效的“棒冰算法”集成至这套异步RL框架中,进一步攻克了深度强化学习训练过程中的稳定性难题。关于这些核心训练技术的更多实现细节与原理,官方表示将在后续发布的技术报告中予以全面披露。

战略聚焦:从“刷分”到“实用”

若将视野放宽,会发现Ring-2.6-1T的开源并非孤立事件。回顾近一个月,蚂蚁百灵已密集迭代并开源了多款模型,覆盖了Ling语言模型与Ring推理模型两大产品线。

一个清晰的战略转向正浮出水面:相较于单纯追逐更大的参数规模或更高的单项评测分数,百灵更加强调“真实生产环境下的实用体验”。其模型系列集体切入了一个关键维度——“Token Efficiency”(令牌效率),即致力于以更少的计算资源消耗,完成更高质量的任务输出。这种对效率的极致追求,显然更贴合企业级应用对成本控制与性能表现的平衡考量。

市场的反馈是最直接的试金石。此前,百灵发布的Ling-2.6-flash模型的匿名测试版“Elephant Alpha”在OpenRouter平台上线后,曾连续多日位列趋势榜榜首,日均tokens调用量达到百亿级别。这从侧面有力印证了,其秉持的“实用主义”技术路线,正在获得广大开发者与市场的积极认可与热烈回应。

来源:https://www.qbitai.com/2026/05/417961.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级

蚂蚁百灵Ring-2.6-1T开源模型Agent执行能力全面升级

蚂蚁百灵开源Ring-2 6-1T模型,核心为可调节的“按需思考”机制,提供high与xhigh两档推理强度。high模式高效处理多轮对话等任务,xhigh模式专攻数学竞赛等高难度挑战。模型采用异步强化学习与“棒冰算法”提升训练效率,战略聚焦于提升真实环境下的计算效率与实用性。

时间:2026-05-20 12:08
海信视像发布会无电视产品 揭示第二增长曲线战略

海信视像发布会无电视产品 揭示第二增长曲线战略

5月8日,海信召开无电视发布会,推出多款3C智能硬件,实现从单一电视向全场景智能生态的战略跃迁。依托显示技术与AI智造平台,海信以屏幕为感知入口,为用户提供全场景科技陪伴。战略转型推动公司从规模驱动转向价值驱动,净利润持续增长,第二增长曲线成效显著。

时间:2026-05-20 12:07
腾讯开源Agent记忆方案大幅降低Token消耗达61%

腾讯开源Agent记忆方案大幅降低Token消耗达61%

腾讯云开源TencentDBAgentMemory技术,针对AI智能体长任务记忆管理痛点,通过“外存内精”思路降低Token消耗。其核心包括动态结构化任务状态的“Mermaid任务画布”,以及将详细结果卸载至外部存储、仅保留摘要索引的“上下文卸载”功能。测试显示,该方案在网页搜索等场景中最高降低61%的Token消耗,并显著提升任务成功率与准确率。

时间:2026-05-20 12:07
AIGC2026峰会参会指南明日520正式发布

AIGC2026峰会参会指南明日520正式发布

中国AIGC产业峰会将于5月20日9:30开幕。议程聚焦智能体从概念到落地,探讨其演进与产业趋势;下午涉及模型开源、场景落地等多元议题。现场有20位嘉宾、主题圆桌及年度榜单。签到从8:30开始,备有早鸟礼品。适逢周三早高峰,建议提前规划出行。

时间:2026-05-20 12:07
Meta重组计划曝光 7000人转岗AI影响20%劳动力

Meta重组计划曝光 7000人转岗AI影响20%劳动力

Meta公司内部备忘录披露,将于5月20日启动全球裁员与组织重组计划,首轮影响约10%员工。公司推行扁平化管理,削减管理层,并计划将约7000名员工转岗至AI相关项目。结合裁员与转岗,此次重组涉及约20%劳动力,同时冻结6000个招聘岗位。此举标志着Meta正以AI原生原则重塑组织,加速向AI战略转型。

时间:2026-05-20 12:06
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程