蚂蚁百灵模型Ling-1T上线华为云:支持万卡专属资源部署

10月18日,华为中国官方发文宣布,蚂蚁集团万亿参数大模型Ling-1T正式上架华为云大模型即服务平台MaaS。作为百灵大模型系列的首款旗舰级“非思考”模型,Ling-1T不仅拥有万亿级的参数规模,而且已全面开源。华为中国方面表示,该模型的部署支持专属资源分配,能够充分释放Ling-1T的模型能力。
据介绍,万亿参数大模型Ling-1T在推理过程中每个token可激活约500亿参数。该模型基于先进的Ling 2.0架构,在超过20T token的高质量、高推理密度语料上完成了预训练,并支持长达128K的上下文窗口。
通过“中训练 + 后训练”相结合的演进式思维链(Evo-CoT)技术,Ling-1T在多项国际权威的复杂推理基准测试中(如代码生成、软件开发、专业数学及逻辑推理等)取得了业界顶尖(SOTA)的表现。即便在输出token数量受限的条件下,该模型仍在多项复杂基准测试中展现出SOTA级性能,实现了推理效率与准确性的平衡。
从华为中国了解到,Ling-1T模型与CloudMatrix384超节点在架构、性能和部署上形成了高度互补。Ling-1T作为高效推理模型,可利用CloudMatrix384超节点为大规模MoE模型提供的加速和优化,在实际应用中发挥出更强的性能,其具体优势如下:
MoE架构与全对等互联:Ling-1T模型采用MoE(混合专家)架构。这类模型的核心在于稀疏激活机制,分布式部署时会产生大量All-to-All通信需求,而传统网络架构难以高效处理。CloudMatrix384超节点通过全对等互联架构,高度契合MoE模型的通信密集型需求,有效避免通信瓶颈。
专家并行与动态负载均衡:Ling-1T模型由256个专家模块组成,模型推理时需激活约500亿参数,推理过程会产生大量网络通信。CloudMatrix384超节点通过超高速互联网络与基于内存语义的零拷贝数据聚合技术,有效突破大规模专家并行计算中的通信瓶颈,为超大规模语言模型推理提供高可靠、低延迟的端到端算力支持,从而在超节点上实现Ling-1T的高吞吐量和低延迟推理任务。
目前,华为云大模型即服务平台MaaS已预置DeepSeek、Qwen3、Kimi等业界主流开源大模型,并基于昇腾AI云服务完成深度适配与优化。模型部署和运行在云端,无需自行处理复杂的硬件和部署问题,用户可通过API接口快速调用LLM、多模态等模型服务。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
国产大模型用户首选,AI半年激增5.15亿
中国互联网络信息中心在2025(第六届)中国互联网基础资源大会上正式发布了《生成式人工智能应用发展报告(2025)》。报告指出,我国生成式人工智能用户规模在2025年上半年呈现爆发式增长,截至6月已
超515亿人次体验!6图看懂我国生成式AI应用全景
作为推动科技革命与产业变革的核心引擎,人工智能正以颠覆性力量重构人类社会的运行逻辑。近年来,我国人工智能产业完成从技术积累到应用爆发的跨越式发展,整体竞争力跃居全球第一梯队。随着“人工智能+”战略的
沈阳先知现代科技:以技术驱动与精准服务引领行业变革
在科技产业蓬勃发展的浪潮中,沈阳先知现代科技有限公司凭借其独特的技术优势与市场定位,逐渐成为东北地区科技创新领域的重要参与者。这家扎根于沈阳的企业,不仅服务于本地市场,更将业务触角延伸至全国多个领域
OpenAI否认暂停GPT-6研发,GPT-5系列迎来重大升级
OpenAI近期在人工智能模型领域的动态引发了广泛关注。尽管外界普遍猜测该公司即将推出新一代大语言模型GPT-6,但最新消息显示这一计划已暂时搁置。据内部人士透露,OpenAI今年将不会发布GPT-
5.15亿用户青睐,国产大模型引领中国AI产业应用新浪潮
中国互联网络信息中心最新发布的《生成式人工智能应用发展报告(2025)》显示,我国生成式AI用户规模已突破5亿人关口。截至今年6月,全国生成式人工智能用户达5 15亿,占网民总数的36 5%,形成全
相关攻略
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















