蚂蚁发布万亿参数Ling-1T模型,多项测试领先,FP8训练及创新方法成亮点
蚂蚁百灵大模型家族迎来重要成员——Ling-1T。这款拥有万亿参数的通用语言模型由蚂蚁集团自主研发,作为Ling 2.0系列的首款旗舰产品,其规模与性能均创下团队历史新高。该模型在复杂推理任务中展现出卓越能力,在有限输出Token条件下,于多项基准测试中刷新最佳成绩,尤其在高效思考与精确推理的平衡方面表现突出。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在竞赛数学领域,Ling-1T的表现尤为亮眼。以美国数学邀请赛25题(AIME 25)为例,该模型仅消耗平均4000余Token即达到70.42%的准确率,超越同期测试的Gemini-2.5-Pro(消耗5000+Token,准确率70.10%)。这种以更少资源实现更高精度的特性,使其在推理效率与准确率的综合评估中占据优势,相关成果已推动该领域帕累托前沿的拓展。
技术架构方面,Ling-1T延续了Ling 2.0的核心设计,依托超过20万亿Token的高质量语料库完成预训练,支持最长128K的上下文窗口。通过"中训练+后训练"的演进式思维链(Evo-CoT)技术,模型在复杂逻辑推导和精准答案生成方面获得显著提升。特别值得关注的是,该模型采用FP8混合精度训练方案,成为当前已知规模最大的FP8基座模型,这项创新使显存占用降低、并行策略更灵活,并实现15%以上的端到端训练加速。
在强化学习阶段,研发团队提出LPO(Linguistics-Unit Policy Optimization)策略优化算法,以"句子"为最小优化单元。这种设计既避免了词元级处理的碎片化问题,又克服了序列级优化的笼统性,使奖励信号与模型输出在语义层面实现精准匹配。同时,团队构建的"语法-功能-美学"混合奖励机制,在确保代码正确性的基础上,显著提升了模型对视觉美学的理解能力。
在前端开发能力评估中,Ling-1T于ArtifactsBench基准测试取得59.31分,虽略低于Gemini-2.5-Pro-lowthink的60.28分,但在开源模型中稳居首位。该模型在代码生成、软件开发、专业数学等领域同样表现优异,多项指标刷新开源社区纪录。目前,开发者可通过Hugging Face平台及蚂蚁百宝箱等渠道体验Ling-1T的完整功能。
据悉,蚂蚁百灵团队还在同步推进深度思考大模型Ring-1T的研发,其preview版本已于9月30日开源。这款聚焦复杂推理的新模型,将与Ling-1T形成能力互补,共同构建更完整的AI技术矩阵。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
AI能从单份血样检出多种神经疾病
来源:科技日报科技日报讯 (记者刘霞)由瑞典隆德大学领衔的国际研究团队,研发出一款新的人工智能(AI)模型。该模型仅需一份血液样本,便能精准识别多种神经退行性疾病。团队期望,该AI模型未来能实现“一
褪去虚火,脑机接口方能释放长远价值
来源:科技日报2026年开年,马斯克宣称脑机接口产品将于年内启动量产,引爆全球市场情绪。国内资本随即扎堆追捧,脑机接口相关概念股大幅走高,行业短期炒作虚火蔓延。进入3月,脑机接口迎来多重利好:脑机接
黎万强、洪锋退出小米科技股东名单
人民财讯4月7日电,企查查APP显示,近日,小米科技有限责任公司发生工商变更,原股东小米联合创始人黎万强、洪锋退出,同时,注册资本由18 5亿元减至约14 8亿元。 企查查信息显示,该公司成立于20
新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月
新华社北京4月7日电 新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月 新华社记者张晓茹 美国东部时间6日18时40分许(北京时间7日6时40分许),执行美国“阿耳忒弥斯2号”载人绕月飞行任
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

