蚂蚁百灵模型Ling-1T上线华为云：支持万卡专属资源部署

首页

热心网友

转载

2025-10-19

来源:https://www.ithome.com/0/890/508.htm

10月18日，华为中国官方发文宣布，蚂蚁集团万亿参数大模型Ling-1T正式上架华为云大模型即服务平台MaaS。作为百灵大模型系列的首款旗舰级“非思考”模型，Ling-1T不仅拥有万亿级的参数规模，而且已全面开源。华为中国方面表示，该模型的部署支持专属资源分配，能够充分释放Ling-1T的模型能力。

蚂蚁集团百灵万亿参数模型Ling-1T上架华为云，支持专属资源部署

▲ 图源：华为中国最新公众号，后同

据介绍，万亿参数大模型Ling-1T在推理过程中每个token可激活约500亿参数。该模型基于先进的Ling 2.0架构，在超过20T token的高质量、高推理密度语料上完成了预训练，并支持长达128K的上下文窗口。

通过“中训练 + 后训练”相结合的演进式思维链（Evo-CoT）技术，Ling-1T在多项国际权威的复杂推理基准测试中（如代码生成、软件开发、专业数学及逻辑推理等）取得了业界顶尖（SOTA）的表现。即便在输出token数量受限的条件下，该模型仍在多项复杂基准测试中展现出SOTA级性能，实现了推理效率与准确性的平衡。

蚂蚁集团百灵万亿参数模型Ling-1T上架华为云，支持专属资源部署

从华为中国了解到，Ling-1T模型与CloudMatrix384超节点在架构、性能和部署上形成了高度互补。Ling-1T作为高效推理模型，可利用CloudMatrix384超节点为大规模MoE模型提供的加速和优化，在实际应用中发挥出更强的性能，其具体优势如下：

MoE架构与全对等互联：Ling-1T模型采用MoE（混合专家）架构。这类模型的核心在于稀疏激活机制，分布式部署时会产生大量All-to-All通信需求，而传统网络架构难以高效处理。CloudMatrix384超节点通过全对等互联架构，高度契合MoE模型的通信密集型需求，有效避免通信瓶颈。

专家并行与动态负载均衡：Ling-1T模型由256个专家模块组成，模型推理时需激活约500亿参数，推理过程会产生大量网络通信。CloudMatrix384超节点通过超高速互联网络与基于内存语义的零拷贝数据聚合技术，有效突破大规模专家并行计算中的通信瓶颈，为超大规模语言模型推理提供高可靠、低延迟的端到端算力支持，从而在超节点上实现Ling-1T的高吞吐量和低延迟推理任务。

目前，华为云大模型即服务平台MaaS已预置DeepSeek、Qwen3、Kimi等业界主流开源大模型，并基于昇腾AI云服务完成深度适配与优化。模型部署和运行在云端，无需自行处理复杂的硬件和部署问题，用户可通过API接口快速调用LLM、多模态等模型服务。

蚂蚁集团百灵万亿参数模型Ling-1T上架华为云，支持专属资源部署