蚂蚁发布两款万亿参数大模型 AI技术实力全面升级
国庆假期,各行各业都进入了休整状态,但大模型的竞技场却比平时更加活跃。短短半个月内,国内外领先团队密集发布了十余款重要产品,展现出不同的技术路线与战略方向。
九月下旬,阿里推出了以Qwen3-Max为代表的系列模型,展示了其综合技术实力;月末,DeepSeek和Anthropic则聚焦于硬核的编程与推理场景,先后发布了DeepSeek V3.2-Exp和Claude Sonnet 4.5。智谱AI也发布了GLM-4.6,旨在成为国内领先的代码生成模型。
有的公司追求全栈布局,有的则专注于单点突破。随着大模型竞争进入深水区,各家公司的战略差异越来越明显。
10月9日凌晨,蚂蚁百灵大模型团队进行了一次重要发布,正式推出了最新的语言大模型Ling-1T,其参数量达到了惊人的1000B(一万亿)。而就在十天前,他们刚刚开源了自研的思考模型Ring-1T-preview。
十天之内,连续发布并开源两款万亿参数规模的模型,如此密集的技术动作,让蚂蚁百灵迅速成为行业关注的焦点。这种近乎“完全开放”的开源策略,也引发了一个核心思考:蚂蚁的长期布局,究竟指向何方?
探索智能上限是终极目标
蚂蚁集团自主研发的基础大模型系列命名为“百灵”,寓意“百试百灵”,也体现了其技术普惠的愿景。与集团内独立研发的路径相似,蚂蚁的百灵团队也坚持着自己的技术探索。此次发布的Ling-1T和此前开源的Ring-1T-preview,分别代表了其技术探索的两个重要分支:非思考模型与思考模型。
过去半年,百灵模型的迭代速度有目共睹。团队自上而下规划了三条清晰的技术路线:基于MoE架构的非思考模型Ling-Series、专注于深度推理的思考模型Ring-Series,以及面向未来的原生全模态大模型Ming-Series。目前,在前两条技术路线上,蚂蚁都已成功将模型参数规模提升至万亿级别。
万亿参数,这个数量级常被类比于人脑的神经元数量,象征着让AI具备类人脑处理能力的雄心。然而,训练一个万亿参数模型,其技术难度和资源消耗极其巨大。纵观国内,有能力跻身“万亿参数俱乐部”的团队屈指可数。
除了蚂蚁的Ling-1T和Ring-1T-preview,目前公开信息显示,也只有Kimi的K2、阿里通义千问的Qwen3-Max、腾讯混元大模型等少数几个。这个俱乐部的技术门槛,非常高。
尽管今年以来,关于“数据瓶颈”和“预训练范式终结”的讨论时有出现,但产业界和学术界正形成一个新共识:更大的模型参数规模、更高质量的训练数据,依然能带来持续的性能提升。阿里的算法负责人曾公开表示,Scaling Law(缩放定律)远未见顶。杨植麟带领的Kimi团队,克服了诸多工程挑战,在两个月前推出了万亿参数的旗舰模型K2。通义千问团队则明确提出了“规模即性能”的发展思路,推动Qwen3沿着扩大规模的路径前进。
由此可见,探索人工智能的性能极限,仍然是头部厂商共同锚定的终极目标。
百灵大模型加速涌现
过去一年,国内大模型领域新品频出,“七天一新款”的说法并不夸张。但随着模型数量增多,另一个关键问题浮现出来:能够在庞大的参数规模与高效的推理性能之间取得完美平衡的模型,实际上非常稀少。
对于万亿参数模型而言,规模上去后,推理速度往往成为瓶颈;而如果追求极致的响应速度,模型的准确率和深度又可能难以保证。业界公认的优秀大参数模型,无一不是在推理能力与计算效率之间找到了一个精妙的平衡点,即所谓的帕累托最优。这个平衡点,通常通过一系列多维度的基准测试分数来综合衡量。
这次蚂蚁发布的Ling-1T,在公开的权威评测榜单中,表现颇为出色。下图展示了Ling-1T在部分核心基准测试中的成绩,红色加粗代表其得分位列第一,黑色加粗下划线则代表第二:

在业界尤为关注的编程与数学推理两大关键维度上,Ling-1T表现非常突出,多项得分甚至超越了以代码能力著称的DeepSeek。在知识理解方面,它的得分也略高于Kimi、GPT-5主干模型等强劲对手。这意味着,Ling-1T在复杂思考、泛化能力以及逻辑推理上,展现出了相当全面的实力。因此,它在代码生成、软件开发、竞赛数学、专业逻辑推理等高阶应用场景中,会具有显著优势。
然而,对于万亿模型,综合性能之外,还有一个关键指标:推理的准确率。这就不得不提到竞赛数学领域的权威测试——AIME 25榜单。Ling-1T在该测试中的成绩如下:

与DeepSeek-V3.1-Terminus、Kimi-K2-Instruct-0905(开源版)以及GPT-5-main、Gemini-2.5-Pro(闭源版)这些顶级模型同台竞技,Ling-1T展示了更短的思考路径和更高的推理准确率。它具备处理128K长文本的能力,而每个token激活的参数量却控制在约500亿,这在计算效率上是一个显著优势。
这份成绩单背后,是蚂蚁百灵团队长期的技术积累与创新。模型依托团队储备的二十万亿Token高质量文本语料进行训练,学习了海量优质知识。在预训练阶段,团队创新地让模型依据“Ling Scaling Laws”自我设置关键超参数,实现了大模型的自我优化。在强化训练阶段,则引入了团队原创的LPO策略优化算法,让模型的回答更精准。此外,团队还提出了“语法-功能-美学”的混合奖励机制,提升了模型输出的综合质量。下图是工程师绘制的Ling-1T模型架构示意图:

事实上,蚂蚁已经构建起一个完整的百灵大模型家族。从参数规模看,涵盖了从160亿到1万亿的总参数产品矩阵;从模态能力看,包含了能看、能听、能说、能画,理解与生成统一的多模态模型;从应用场景看,则形成了可在手机端运行的Ling-mini、适合中小企业服务器部署的Ling-flash,以及云端调用的Ling-1T等系列。

这个产品家族在过去一段时间里,无论是在社区评测榜单还是实际应用反馈中,都获得了不少积极评价。百灵团队开发的全模态模型Ming-lite-omni v1.5,曾在Hugging Face的“any to any”模型趋势榜上登顶。Ring-1T-preview发布次日,便冲上Hugging Face文本生成总榜第三,而排名第四的同样是百灵家族9月发布的混合架构思考模型Ring-flash-linear-2.0。
更值得一提的是来自业界的真实反馈。图灵奖得主杨立昆(Yann LeCun)甚至点赞并评论“Impressive”(令人印象深刻),了解这位对LLM时常持批评态度的学者的网友都表示,这声夸奖“来之不易”。一位苹果工程师在量化并本地运行模型后评价,其性能“Getting closer to GPT-5 at home”(在本地部署上已接近GPT-5)。这些来自一线技术开发者的反馈,无疑是对百灵模型技术实力的有力认可。
探索AGI,亟需参与者们的共建意识
百灵团队能如此迅速地跻身“万亿参数俱乐部”,与蚂蚁集团的整体战略投入密不可分。作为一家成立二十年的科技公司,蚂蚁在AI领域的布局决心和资源投入一直非常坚定。
去年蚂蚁二十周年时,董事长井贤栋明确宣布,未来二十年,蚂蚁要成为一家科技与创新双轮驱动的公司。集团随后提出的“AI First”战略,与“支付宝双飞轮”、“加速全球化”并列,成为驱动蚂蚁前进的三大核心战略。Ling-1T和Ring-1T-preview的接连亮相,正是“AI First”战略持续加速落地的鲜明体现。
然而,蚂蚁选择的不是封闭的闭源道路,而是技术共享的开源路线。这充分表明,其目光投向的是更远的未来:通过技术开放,持续迭代,构建一个真正繁荣、开放的AGI(通用人工智能)生态系统。
据行业观察,目前“万亿参数俱乐部”中,能做到完全开源的,仅有蚂蚁百灵的Ling-1T、Ring-1T-preview和Kimi的K2。在2025年大模型参数“军备竞赛”白热化的背景下,投入巨资研发后却选择开源,初看确实令人费解。
但若理解开源背后的深层逻辑,便会豁然开朗。当Ling-1T这样的万亿参数“巨兽”公开其训练数据、算法和模型细节,全球开发者便能直接以此为基础,快速构建复杂应用,而无需从零开始攻克底层训练的难题。一个“使用-反馈-迭代”的正向循环由此建立,这将极大推动技术的共同演进,加速智能的“涌现”。这条“技术平权化”的道路,其实已有先行者。今年年初DeepSeek的横空出世,就已经为国内大模型玩家们示范了开源所能激发的巨大能量。
今年接任蚂蚁集团CEO的韩歆毅,曾在内部技术日上清晰地阐述了蚂蚁的AI主张:“年初我们讨论(蚂蚁)聚焦AI应用,还要不要做基础大模型时,答案非常坚决:一定要做。因为如果基于AI做服务和应用,就像训练一个人去做所有的事。追求智能的上限,会让这个人更加聪明,从而能够做更多、更好的服务。我们坚定地要去探索AGI,探索智能的极限。”
为此,蚂蚁专门成立了InclusionAI开源组织,并建设了涵盖强化学习推理框架AReaL、多智能体框架AWorld等在内的大模型全栈技术体系。这些技术成果也已通过开源、开放合作的形式与行业共享,旨在让更多的开发者和研究者能够交流、共创。
看得出来,相比于独自在舞台上表演,蚂蚁更倾向于搭建一个宽阔的舞台,铺设好AI的基础设施。因为只有生态繁荣了,才能吸引更多的参与者共同建设,那条通往AGI的道路,也才能真正走得通、走得远。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
网易CodeWave人工智能开发平台重塑企业智能研发流程
2025年10月14日,网易CodeWave在主题沟通会上重磅发布了“用AI重构研发方式”的战略愿景。会上,一系列全新的智能开发能力正式亮相,旨在实现从需求分析、产品设计到代码开发、部署运维及迭代优化的全流程智能化赋能。这不仅是开发工具的升级,更代表了企业级软件开发范式的深刻演进。作为专注于企业级市
汪军与Rich Sutton对话:大模型是否偏离了智能本质的探索
在刚刚落幕的RL China 2025开幕式上,一场跨越地域的思想对话备受瞩目。伦敦大学学院的汪军教授与图灵奖得主、被誉为“强化学习之父”的Richard Sutton,从学科根基出发,共同探讨了智能的本质与未来方向。这场对话,不仅关乎技术路径,更触及了人工智能研究的初心与使命。 作为强化学习领域的
高德地图AI应跳出传统竞争思维专注创新
高德进军到店业务的消息,近期在行业内引发了广泛关注。昨日,官方正式揭晓答案——并非重启口碑业务,而是推出了“高德扫街榜”。虽然方向已明,但随之而来的疑问却更多了。 过去数月,外卖市场的补贴竞争异常激烈。如今高德加码本地生活服务,是否意味着新一轮补贴大战即将开启?十年前,美团在团购领域脱颖而出,如今阿
Win11任务栏位置自定义设置与文件搜索效率优化指南
微软向Windows预览体验计划成员推送了Win11系统的新一轮更新,重点改进了任务栏的个性化设置与搜索功能。用户现在可以自由将任务栏放置在屏幕的上下左右任意一边,并可选更紧凑的“小任务栏”模式以节省屏幕空间。同时,系统搜索框的逻辑得到优化,在用户查找内容时,会优先显示高度匹配的本地文件和应用程序,
开发者如何抓住GDC千亿商机与财富机遇
人工智能创业者Steven回顾艰辛历程,从技术理想转向现实挑战,面临融资与团队生存压力。全球开发者先锋大会汇聚顶尖投资机构,提供项目路演与资本对接平台,成为其寻求突破的关键机遇。大会旨在探索大模型产业化落地,推动商业闭环,助力开发者实现价值。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

