蚂蚁开源Ling-1T万亿模型,刷新多项开源基准记录
10月9日最新消息,蚂蚁集团正式推出具有万亿参数的通用语言大模型Ling-1T。作为蚂蚁百灵大模型Ling 2.0系列的首款旗舰产品,Ling-1T不仅是该团队研发的最大规模模型,同时也代表了其当前最强大的非推理型大模型实力。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
权威测评数据显示,在受控输出条件下,Ling-1T在多项复杂推理基准测试中取得了业界领先表现。特别值得一提的是,该模型在代码生成、软件开发、数学竞赛解题、专业数学推导和逻辑推理等高难度测试项目中均位居开源模型前列,多项核心指标刷新纪录。
性能亮点
以美国数学邀请赛AIME 25为例,Ling-1T仅需平均4000+ Token就能实现70.42%的准确率,优于Gemini-2.5-Pro(5000+ Token,70.10%准确率)。这一结果充分展示了Ling-1T在推理精度和效率上的双重优势。
核心技术
蚂蚁百灵团队透露,Ling-1T沿用了Ling 2.0架构,基于超过20T tokens的高质量预训练数据进行训练。模型支持128K上下文窗口,并创新性地采用了"中训练+后训练"的演进式思维链(Evo-CoT)技术,显著提升了模型的思考效率和推理准确性。
泛化能力
研发过程中团队发现,模型规模的扩大与推理能力的提升往往会带来跨领域的意外惊喜。譬如在BFCL V3智能体工具调用任务中,Ling-1T在仅进行少量指令微调的情况下就实现了约70%的调用准确率。该模型能够将复杂的逻辑问题转化为可视化组件,生成多端兼容的前端代码,或创作符合特定风格的营销文案。
当前局限
- 仍采用GQA注意力架构
- 超长上下文处理成本较高
- 智能体交互能力有待提升
- 部分场景下存在角色混淆现象
开放资源
开发者可以访问以下渠道体验Ling-1T:
- HuggingFace仓库
- ModelScope模型平台
- GitHub开源项目
- 国内用户专属聊天体验入口
- 面向海外开发者的ZenMux平台
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
腾讯上线微信/QQ零钱继承服务:最快24小时到账,践行数字遗产温情守护
2026年4月3日,腾讯客服正式上线升级版逝者微信及QQ零钱资金继承服务。在申请材料齐全的前提下,资金提取通常可在一至三个工作日内完成,最快24小时内到账。统计数据显示,在立遗嘱的“90后”群体中,
福特GT Mk IV以6分15秒977创纽北最快燃油量产车纪录
2026年4月3日,福特中国正式宣布,旗下高性能赛道专属车型福特GT Mk IV在德国纽博格林北环赛道完成最新认证圈速测试,成绩为6分15秒977,成为该赛道有史以来圈速最快的纯燃油量产规格车型,同
Denuvo遭遇超管理器级破解,安全与性能博弈升级
4月3日,全球游戏破解领域出现显著变化:曾以高强度防护著称的Denuvo加密技术,正遭遇其问世以来最严峻的挑战。过去,主流3A游戏往往需要数月才能被成功破解;如今,新作在正式发售当天即被绕过,已逐渐
索尼Xperia 1 VIII曝光方形三摄设计,告别六年竖排方案
近日,索尼下一代旗舰机型Xperia 1 VIII的外观渲染图在网络平台流传。 图像显示,该机后置模组采用方形布局,配备三枚摄像头,是索尼近年来在旗舰机型工业设计上最具突破性的一次调整。自2020
3i计划线上发布会4月10日揭幕:40款游戏实机首曝,纯内容45分钟无广告
由法国独立游戏工作室Evil Empire发起,联合全球多家知名开发团队共同打造的线上游戏发布会“3i计划”,将于2026年4月10日零点正式揭幕。本次发布会以“3i游戏年度阅兵”为主题,首次完整公
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

