当前位置: 首页
AI
GLM-5力挺国产芯片 Day0支持方案全解析

GLM-5力挺国产芯片 Day0支持方案全解析

热心网友 时间:2026-02-20
转载

2月11日,智谱AI正式上线并开源了其新一代大语言模型GLM-5。消息一出,立即在国产芯片生态中引发连锁反应,多款国产核心芯片平台随后相继宣布,已完成对GLM-5的“Day 0”级适配。所谓“Day 0”适配,指的是在产品发布或系统上线的当天(第0天),就能实现完全兼容与稳定运行的能力。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

海光信息对此表示,在本次合作中,海光DCU团队与智谱AI展开了深度协同。凭借自研的DTK等软件栈技术优势,团队重点优化了底层算子和硬件加速能力,使得GLM-5在海光DCU上能够实现高吞吐、低延迟且运行稳定的表现,充分释放了“国产算力+国产大模型”的组合价值。

摩尔线程方面则透露,基于SGLang推理框架,该公司在其旗舰级AI训推一体全功能GPU——MTT S5000上,于产品正式发布前便已完成全流程适配与验证。借助MUSA架构的算子覆盖和生态兼容能力,摩尔线程打通了模型推理的全链路,并深度释放了MTT S5000原生FP8加速性能,在确保模型精度的同时,显著降低了显存占用,最终实现了GLM-5的高性能推理。

不仅如此,摩尔线程还首次公布了MTT S5000的详细算力参数。该显卡基于第四代MUSA“平湖”架构打造,单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽高达1.6TB/s,卡间互联带宽为784GB/s,并且完整支持从FP8到FP64的全精度数据类型计算。

后续有消息确认,目前智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化,这意味着GLM-5能够在国产算力集群上实现高吞吐、低延迟的稳定运行。

据介绍,GLM-5在编程与智能体能力方面取得了开源领域领先的表现。其在真实编程场景下的使用体感已接近Claude Opus 4.5,尤其擅长处理复杂系统工程与长程智能体任务。

从具体升级来看,其参数规模从之前的355B激活32B,扩展至744B激活40B;预训练数据从23T提升至28.5T,大幅提升了模型的通用智能水平。同时,团队构建了全新的“Slime”异步强化学习框架,能够支持更大模型规模及更复杂的强化学习任务,通过异步智能体强化学习算法,模型能够持续从长程交互中学习。此外,GLM-5首次集成了DeepSeek Sparse Attention稀疏注意力机制,在维持长文本处理效果无损的同时,大幅降低了模型的部署成本,提升了单位Token的处理效率。

一个月前,智谱的图像生成模型GLM-Image也已发布。该模型创新性地采用了“自回归+扩散解码器”的混合架构,是智谱面向“认知型生成”技术路线的一次重要探索,也是业内首个实现工业级表现的开源离散自回归图像生成模型。

当时,华为计算方面表示,昇腾NPU和昇思MindSpore AI框架为GLM-Image提供了从数据到训练的全流程支持,并提出了一系列训练性能优化特性,助力智谱高效训练出了首个基于自主创新算力底座完成全程训练的领先模型。

来源:https://www.163.com/dy/article/KLIDE8JB051481US.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
新加坡国立大学破解AI看图说话难题让机器描述更准确

新加坡国立大学破解AI看图说话难题让机器描述更准确

人工智能的“幻觉”问题,特别是大模型在图像描述任务中凭空捏造内容的现象,一直是制约其可靠应用的关键挑战。2026年2月,一项由新加坡国立大学与北京大学深圳研究生院联合发布的突破性研究,为这一难题提供了全新的理解与一套高效、简洁的解决方案。这项研究(论文预印本编号:arXiv:2602 22144v1

时间:2026-05-12 22:51
斯坦福大学JavisDiT++实现AI有声有色视频生成

斯坦福大学JavisDiT++实现AI有声有色视频生成

这项由浙江大学、新加坡国立大学、多伦多大学等全球顶尖科研机构联合完成的研究成果,已正式发表于2026年国际学习表征会议(ICLR 2026),论文预印本编号为arXiv:2602 19163v1。对于希望深入探究技术细节的读者,可通过此编号查阅完整的学术论文。 在浏览短视频时,你可能已经察觉到一种普

时间:2026-05-12 22:51
北大提出AI推理双车道方案解决大模型对话卡顿难题

北大提出AI推理双车道方案解决大模型对话卡顿难题

这项由北京大学计算机学院主导,联合清华大学及DeepSeek-AI共同完成的前沿研究,其成果已正式发布于2026年2月的arXiv预印本平台,论文编号为arXiv:2602 21548v1。关注大语言模型推理优化的研究者与开发者,可通过此编号查阅论文全文与技术细节。 在与大语言模型进行深度、多轮对话

时间:2026-05-12 22:50
清华大学AI突破:赋予虚拟世界持久记忆,解决视频生成失忆难题

清华大学AI突破:赋予虚拟世界持久记忆,解决视频生成失忆难题

想象一下,你正在体验一款开放世界游戏。当你站在高塔之巅,远方的山脉清晰可见。随后你转身离开,去探索地图的其他角落。许久之后,当你再次回到这座塔顶,那座山依然以完全相同的姿态矗立在原地。这种空间持久且一致的认知,是人类理解世界的基础。 然而,若让当前的主流AI来动态生成这样的游戏场景,结果会大相径庭。

时间:2026-05-12 22:50
大模型压缩技术COMPOT让AI运行更高效

大模型压缩技术COMPOT让AI运行更高效

随着人工智能模型参数规模不断突破千亿级别,其庞大的存储需求和计算开销已成为实际部署的主要瓶颈。针对这一挑战,MWS AI基础研究中心与ITMO大学联合提出了一种名为COMPOT的创新模型压缩技术。这项发表于2026年2月预印本平台(arXiv:2602 15200v1)的研究,为大语言模型高效“瘦身

时间:2026-05-12 22:50
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程