摩尔线程驱动更新:强化AI模型训练与推理支持
11月28日消息,摩尔线程近日正式发布了基于PyTorch深度学习框架的MUSA扩展库——Torch-MUSA v2.7.0。最新版本在功能集成、性能优化与硬件支持等方面均取得显著突破。值得注意的是,Torch-MUSA在一个月内已连续完成v2.5.0和v2.7.0两次重要迭代。
据了解,自v2.5.0版本开始,Torch-Musa已与PyTorch主版本号保持同步,方便开发者进行版本识别与管理。新版本进一步集成muSolver与muFFT等计算加速库,显著提升复杂计算任务的执行效率。同时新增对统一内存设备(Unified Memory)的UMM支持,有效优化了内存使用效率。
新版继续保持与最新MUSA SDK的兼容性,支持使用MUSA SDK 4.2.0至4.3.0及更高版本进行编译。目前Torch-MUSA专属支持的算子总数已突破1050个,系统在性能表现与运行稳定性方面均有明显提升。
v2.7.0版本主要包含以下更新内容:
新增特性
集成muFFT与muSolver计算库,大幅扩展框架计算能力;
面向边缘计算的SoC设备支持统一内存管理,基于Arm架构的UMA(统一内存寻址)设计,实现GPU与CPU共享同一物理内存空间,显著降低模型运行过程中的内存开销。具体优化包括:消除GPU端重复内存分配;减少主机与设备间的内存拷贝;GPU可直接访问由CPU分配器申请的内存空间。
算子扩展与性能优化
新增支持ilshift、irshift、replication_pad1d_bwd、angle、ctcLossTensor、ctcLossTensorBwd、logit、amin/amax/prod.dim_int、glu_bwd等多个核心算子;
新增基础Sparse (CSR) 操作支持;
扩展量化算子支持范围;
修复torch.norm形状参数异常问题;
支持reduce_sum的uint8输入与int64输出;
C++扩展新增支持tensor.is_musa方法;
修复空输入条件下argmax/argmin的异常行为;
优化var/std、pad、convolution3d、layer_norm等关键操作的执行效率。
系统功能增强
开放torch.musa.mccl.version接口;
支持getCurrentMUSABlasHandle与getCurrentMUSABlasLtHandle;
优化FSDP2流水线并行策略,有效降低训练过程中的内存占用。
根据最新消息,Torch-MUSA将持续跟进PyTorch版本更新,计划下一版本支持PyTorch 2.9.0,并进一步优化系统性能与功能特性。
Torch-MUSA开源地址:https://github.com/MooreThreads/torch_musa
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
DeepSeek宣布永久降价 梁文锋大幅让利远超市场预期
DeepSeek宣布其Pro模型API优惠将转为永久降价,调用成本大幅降低至原价的四分之一。同时,公司正进行高达500亿元的首轮融资,创始人梁文锋个人计划出资200亿元以强化控制权。降价与巨额融资相结合,旨在降低行业门槛、构建生态,并支撑其长期开源与AGI战略,展现了公司的长期主义视野。
国产600公斤推力涡扇发动机首飞成功 中国心实现自研突破
5月23日,搭载国产F406涡扇发动机的气象无人机首飞成功。该发动机推力600公斤级,由我国自主研制,拥有完整知识产权,实现了中小推力高端涡扇发动机的自主可控。其具备高空高速稳定运行能力,填补了国内相关技术空白,将为无人机及低空经济发展提供可靠动力支撑。
小米米家空调巨省电Pro大1.5匹价格降至1868元
2026年3月6日,备受期待的小米米家巨省电 Pro 空调 2026 款正式上市销售。作为新品,其大1 5匹型号的官方首发定价为2499元,性价比优势显著。 恰逢京东618年中购物节,这款新上市的空调迎来了绝佳的入手时机。消费者通过叠加平台提供的促销优惠与政府发放的节能补贴,最终到手价格可以做到更具
国产600公斤推力涡扇发动机成功完成首次飞行
5月23日,我国自主研制的600公斤推力级F406涡扇发动机成功完成首次飞行试验。发动机驱动气象无人机平稳飞行并安全返航,各项参数稳定。此次试飞标志着我国在中小推力高端涡扇发动机领域实现了自主可控与国产化突破,该发动机将为低空经济和无人体系提供关键动力支撑。
国产600公斤推力涡扇发动机首飞成功核心技术自主研制
5月23日,我国自主研制的600公斤推力级F406涡扇发动机成功完成首次飞行试验。该发动机以双发配置驱动一架先进气象无人机,全程工作平稳,安全返航。此次试飞标志着我国在中小推力高端涡扇发动机领域实现自主可控与国产化,将为低空经济与无人体系发展提供可靠动力。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

