摩尔线程亮牌全栈技术与“花港”新架构,突破万卡集群与高端GPU市场
来源:环球网
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
【环球网科技报道 记者 李文瑶】12月20日,摩尔线程在首届MUSA开发者大会(MDC 2025)上,系统展示了其在全功能GPU领域从架构创新、集群能力到生态建设的突破。
其中最引人关注的是新一代GPU架构“花港”的亮相,以及可支撑万亿参数模型训练的“夸娥”万卡智算集群的实际效率披露。
架构迭代:“花港”亮相,双芯片路线瞄准AI与图形
大会的核心发布之一是新一代全功能GPU架构“花港”。根据摩尔线程公布的信息,该架构在计算密度上提升50%,效能提升最高达10倍,并完整支持从FP4到FP64的全精度计算。尤为关键的是,架构层面集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供了底层支持。

“生态体系是GPU行业的核心护城河与价值所在。”摩尔线程创始人、董事长兼CEO张建中在主题演讲中强调。他透露,基于“花港”架构,公司已规划两款芯片:专注于AI训练与推理一体化的“华山”,以及瞄准高性能图形渲染的“庐山”。其中,“庐山”在图形性能上宣称实现数量级提升,AI计算、几何处理及光线追踪性能分别提升64倍、16倍和50倍。
这一架构与产品路线的发布,标志着摩尔线程不再局限于单一场景的加速卡产品,而是向覆盖AI计算、图形渲染、科学计算等全场景的“全功能GPU”平台迈进。在业内人士看来,这既是技术能力的体现,也是应对市场多元需求、构建更宽生态护城河的战略选择。
集群能力:万卡训练效率指标首度公开
如果说芯片架构是“点”的突破,那么集群能力则是“面”的验证。本次大会上,摩尔线程首次系统披露了其“夸娥”万卡智算集群的关键工程效率指标,使其成为国内少数公开万卡级实际训练效率的厂商之一。
数据显示,该万卡集群在训练稠密(Dense)大模型时,模型算力利用率(MFU)达到60%,训练混合专家(MOE)模型时MFU为40%,训练线性扩展效率达95%,有效训练时间占比超过90%。这些指标,特别是MFU,是衡量超大规模AI集群实际效能的关键,其数值直接关系到训练的总体成本与可行性。
“虽然构建国产万卡乃至十万卡级别的超大规模智算系统存在难度,但这是必须完成的产业基础设施任务。”中国工程院院士、清华大学计算机系教授郑纬民在大会演讲中说道。他认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,而集群能力的突破是发展“主权AI”、实现“算力自主”不可或缺的一环。
在推理侧,摩尔线程联合硅基流动,在DeepSeek R1 671B全量模型上实现了性能突破。经优化后,MTT S5000单卡在Prefill阶段吞吐量突破4000 tokens/s,Decode阶段突破1000 tokens/s。这一数据为国产GPU在超大规模模型推理场景树立了新的性能基准,也反映了从硬件到软件系统级调优的成效。
生态开放:从软件开源到开发者赋能,构筑长期壁垒
硬件与集群的突破之外,本次大会的另一条主线是生态的开放与赋能。摩尔线程宣布,其自主统一的软件架构MUSA已迭代至5.0版本,并计划逐步开源包括计算加速库、通信库及系统管理框架在内的核心组件。
“开发者是生态建设的关键,国产芯片平台必须构建起友好、易用的开发环境。”郑纬民院士特别强调了开发者在生态中的核心作用。为降低开发门槛,摩尔线程发布了搭载自研“长江”智能SoC的AI算力本MTT AIBOOK,提供端侧50TOPS算力,旨在实现从芯片到开发环境的全栈整合与“开箱即用”。
同时,其面向开发者的“摩尔学院”平台已汇聚近20万学习者,并通过校企合作覆盖全国超200所高校。这种从底层技术开源、到开发工具供给、再到人才早期培养的全链路生态建设思路,折射出国产GPU企业对于行业规律的理解——生态的构建是一场需要长期投入、多方协同的马拉松。
技术融合与前沿探索:图形、AI与科学计算交汇
本次发布也揭示了GPU技术演进的前沿趋势:即图形、AI与高性能计算的深度融合。摩尔线程宣布,基于“花港”架构实现了硬件级光线追踪加速,并推出了自研的AI生成式渲染技术MTAGR 1.0,推动渲染从“计算”走向“生成”范式。
此外,公司已在具身智能、科学智能(AI for Science)、AI for 6G等前沿交叉领域展开布局,发布了具身智能仿真训练平台MT Lambda及相应的机器人解决方案。这些举措表明,其技术路线并非仅追逐单一的AI算力,而是着眼于GPU作为通用计算平台在未来更广阔场景中的渗透与价值重塑。
自主算力进入“系统攻坚”与“生态破局”深水区
摩尔线程此次的全栈技术展示,从一个侧面反映了当前国产高端算力发展的阶段特征:从单点芯片的“从无到有”,正进入需要攻克超大规模系统工程、构建繁荣应用生态的“深水区”。
万卡集群的效率公开,意味着国产算力基础设施已开始接受大规模、高负荷实际场景的检验。而架构的迭代、图形与AI的融合,以及对科学计算等前沿领域的探索,则展现了企业试图参与定义下一代计算架构的技术布局。
然而,通往成熟生态的道路依然漫长。硬件性能的持续提升、软件栈的深度优化、与国内外主流开发框架及应用的广泛兼容,以及吸引足够数量和质量开发者形成网络效应,均是摆在所有国产GPU厂商面前的共同课题。
此次,随着“花港”架构及后续芯片路线图的公布,摩尔线程已将其技术蓝图进行详细披露。然而,能否将全栈自研的技术实力,真正转化为可持续的开发者生态与行业渗透力,仍将是一场考验定力、协作与市场智慧的长期工程。这也将推动国产高端算力的发展,从单点突破驶入系统攻坚与生态构建的深水区。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
3.3秒破百的莲花FOR ME上市 插混超跑SUV售50.8万起
莲花品牌旗下全新超跑SUV——FOR ME正式登场,共推出两款配置车型,最新指导价区间为50 8万至55 8万元。作为全球首款基于超混架构打造的车型,新车融合了高性能插混系统与尖端科技配置,在动力性
专注五载卸半挂赛道,中天金骏以“专而精”书写行业成长范本
在我国专用车行业深度调整的浪潮中,一家成立仅五年的企业——中天金骏,凭借精准的战略定位与持续的技术创新,在竞争激烈的市场中脱颖而出,成为后卸半挂车领域的佼佼者。近年来,随着市场需求结构的变化、新能源
保时捷纯电卡宴电池揭秘:一体化散热设计成就高性能
保时捷全新纯电卡宴凭借1140马力的强劲动力,一举成为品牌历史上性能最强的量产车型。这款车型不仅在动力输出上实现突破,更通过电池系统的创新设计,达成约600公里的续航里程,重新定义了高性能电动车的标
科大讯飞学习机三款选购指南:高性价比型号实测,助力精准学习
随着教育科技领域的快速发展,学习机已成为许多家庭辅助孩子学习的重要工具。在众多品牌中,科大讯飞凭借其技术实力与教育资源积累,逐渐成为家长关注的焦点。近期,不少家长询问如何选择适合孩子的学习设备,本文
回顾宝马i3十余年:面对纯电热潮如何把握观望时机
在汽车行业技术路线多元化的当下,不少车企选择重新聚焦内燃机研发,或在纯电平台中引入增程系统以应对市场变化。然而,宝马集团对此保持审慎态度,暂未明确表态将跟进这一趋势。宝马与增程技术的渊源可追溯至20
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

