PyTorch MUSA 2.7.0发布:功能与性能双升级,加速AI计算效率
摩尔线程近日宣布,专为PyTorch深度学习框架打造的MUSA扩展库——Torch-MUSA正式迎来v2.7.0版本升级。此次更新距离上一个v2.5.0版本发布仅间隔一个月,充分彰显了该库在迭代速度与功能演进上的持续加速。新版本不仅在计算能力、内存管理等核心领域实现重要突破,更通过算子扩展与系统层面的联合优化,进一步巩固了其性能优势。
版本同步策略的调整为此次升级奠定了重要基础。自v2.5.0版本起,Torch-MUSA开始采用与PyTorch主版本号对齐的命名规则,此举显著简化了开发者的版本管理流程。在硬件兼容性方面,新版全面支持MUSA SDK 4.2.0至4.3.0及后续版本,确保与最新开发工具链无缝衔接。目前该库已累计支持超过1050个专属算子,全方位覆盖深度学习训练与推理的核心需求场景。
计算加速能力的拓展是本次升级的核心亮点。新版本深度整合了muFFT快速傅里叶变换库与muSolver线性求解器库,使复杂数学运算的执行效率获得质的提升。为满足边缘计算场景需求,开发团队在基于Arm架构的SoC设备上实现了统一内存管理(UMM)支持。通过UMA(统一内存寻址)技术,GPU与CPU可共享同一物理内存空间,彻底消除GPU端的重复内存分配,减少主机与设备间的数据拷贝次数,同时允许GPU直接访问CPU分配的内存区域,使内存开销降低达30%以上。
算子支持体系迎来全面扩容。新增算子覆盖位运算(ilshift/irshift)、序列填充(replication_pad1d_bwd)、概率计算(angle/logit)、语音识别(ctcLossTensor系列)等十余个专业领域,同时扩展了稀疏矩阵(CSR格式)操作与量化算子的支持范围。针对开发者反馈的问题,修复了torch.norm形状计算错误、空输入条件下argmax/argmin异常等已知缺陷,并新增tensor.is_musa方法用于设备类型检测。在性能优化方面,var/std统计计算、3D卷积、层归一化等关键操作的执行效率提升15%-20%,reduce_sum操作新增对uint8输入与int64输出的完整支持。
系统级功能增强包含三大方向:开放torch.musa.mccl.version接口用于版本查询,新增getCurrentMUSABlasHandle系列API强化底层控制能力,优化FSDP2流水线并行策略使训练内存占用减少25%。这些改进使大规模模型训练的稳定性与资源利用率得到显著提升。
开发团队透露,Torch-MUSA将保持与PyTorch生态的紧密同步,下一版本计划实现对PyTorch 2.9.0的完整支持,并持续在算子覆盖、硬件加速、内存管理等领域进行深度优化。该项目已通过GitHub平台完全开源,开发者可访问指定地址获取完整代码与文档支持。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
叮咚买菜或将并入美团 前置仓模式持续驱动业务增长
叮咚买菜一季度GMV与营收连续九季度增长,国内业务收入提升且履约费用率下降,前置仓模式在华东效率优化。该业务已被列为终止经营,正等待美团收购审查。同期海外业务收入暴涨但亏损扩大,涵盖进口与出海板块。公司整体处于国内业务待交割与海外新投入的过渡阶段。
AI时代如何获取新知成为创作者必备技能
从“AI画饼”到“真金白银”:大模型商业化的现实路径与盈利模式 大模型的热潮已持续近两年。从最初的万众瞩目到如今的理性回归,整个行业面临的核心挑战愈发清晰:技术固然领先,但可持续的商业模式在哪里?当资本热潮逐渐消退,实现商业化盈利已不再是战略选项,而是企业生存与发展的关键底线。 当前市场已形成明
绿联新款160W速显充电器上市 多口输出功率全面升级
对于需要同时为笔记本电脑、手机、平板等多台数码设备高效充电的用户而言,一款大功率、多接口且智能分配的桌面充电器堪称“全能能量站”。近期,绿联对其广受欢迎的160W速显充电器进行了重要升级,新款产品在核心输出性能、便携体验乃至细节设计上均有优化,官方售价为279元。 产品最显著的亮点,是正面搭载的多视
美军战斗机遭两发光球体追击 UFO机密档案再公开
美国国防部5月22日公布第二批UFO机密档案,包含视频与文件。其中一段2024年红外视频显示不明物体高速掠过飞机;另一份2025年报告记录两颗发光球体曾追逐美军战斗机。军方表示调查后仍无证据表明与外星生命有关,但许多案例至今无法解释。
英特尔四代酷睿曝光 Hammer Lake统一核心与超线程技术解析
关于英特尔未来几代酷睿处理器的路线图,近期又有了新的爆料和解读。上个月曾有消息称英特尔放弃了为“Nova Lake”系列推出-AX型号的计划,但事情似乎没那么简单。 知名爆料人Moore‘s Law Is Dead在他的最新视频中澄清,英特尔并未彻底抛弃Nova Lake-AX处理器,但内部对此确实
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

