中昊芯英刹那TPU芯片首发适配智谱GLM-5
2月12日,智谱AI正式发布并开源全新一代旗舰大模型GLM-5。几乎在同一时间,国内唯一掌握TPU架构高性能AI芯片核心技术并实现量产的企业——中昊芯英,便完成了对GLM-5的Day0推理适配。这一联动,释放了怎样的行业信号?
依托自研TPU芯片“刹那®”的高带宽近存架构与高效张量计算核心,GLM-5已在中昊芯英的计算平台上实现高吞吐、低延迟的稳定运行。此举不仅是双方生态合作的重要里程碑,更标志着专用算力芯片TPU在复杂工程化场景(如Coding与Agent)中的性能优势得到集中展现。
GLM-5:AgenticEngineering时代最强开源模型
GLM-5是智谱AI推出的最新基座模型,参数规模扩展至744B,并首次集成稀疏注意力机制。在真实编程场景中,其体验已逼近Claude Opus 4.5,成为当前开源领域最出色的Coding与Agent模型之一。在全球权威的ArtificialAnalysis榜单上,GLM-5位列全球第四、开源第一。

(GLM-5在ArtificialAnalysis榜单中全球排名第四、开源排名第一)
在多项学术基准测试中,GLM-5相较GLM-4.7均实现显著提升,尤其在推理、编码及智能体任务上,斩获全球所有开源模型的最佳成绩,进一步缩小了与前沿模型之间的差距。

(GLM-5在众多学术基准测试中的表现情况)
Day0适配之路:TPU赋能Coding与Agent规模化落地
“刹那®”TPU架构高性能AI专用算力芯片,由中昊芯英历时近5年100%自研,拥有完全自主可控的IP核、全自研指令集及计算平台。在AI大模型计算场景中,其算力性能超越海外知名GPU产品近1.5倍,能耗降低30%。同时,通过Chiplet技术与2.5D封装,在同等制程工艺下实现性能跃升,并支持1024片芯片片间互联,实现千卡集群线性扩容,足以支撑超千亿参数的大模型运算需求。

(中昊芯英TPU架构高性能AI专用算力芯片实物图)
实际上,中昊芯英对GLM全系列模型一直保持深度跟踪与持续适配优化。在之前GLM-4.5和4.7的适配过程中,研发团队基于“刹那®”TPU的近存架构与高效张量核心,完成了芯片与GLM系列模型架构的深度融合,显著提升了GLM-4.5和4.7在TPU集群上的推理吞吐量。这些技术积累,为本次GLM-5的Day0高效适配奠定了扎实的底层算子库和工程经验。
TPU架构天生为AI/ML场景而生。通过优化计算单元维度与数据传输路径,在大模型推理/训练等特定计算范式下,TPU相比传统GPU架构能够实现更高能效比与计算密度。在长期与GLM系列模型的适配过程中,“刹那®”芯片的可重构多级存储、近存运算设计以及流水线式时空映射,有效提升了GLM大模型的计算速度与精度,为模型处理复杂任务提供了高效支撑。
依托自研的GPTPU软件栈,中昊芯英“刹那®”TPU原生适配PyTorch、vLLM、DeepSpeed、Megatron-LM及SGLang等主流深度学习框架与推理引擎,帮助用户实现算法“零成本”跨平台迁移。无论是构建支持1024芯片片间互联的“泰则®”大规模计算集群,还是部署面向Coding和Agent场景的高并发、低延迟在线推理服务,中昊芯英均展现出对标主流专用算力产品的卓越能效与稳定性。可以说,它正在为AIGC时代构筑坚实、易用的国产专用算力底座。

(中昊芯英TPU芯片AI软件栈架构图)
从计算单元到集群:软硬件协同与核心技术突破
GLM-5拥有高达744B的超大规模参数,并首次集成稀疏注意力机制,对底层算力的并发性、通信带宽及指令调度提出了极高要求。中昊芯英从计算、通信、调度三层面实现技术突破,系统性构筑了从单芯片到千卡集群的软硬一体高效计算底座:
·算力协同优化:攻克稀疏计算瓶颈
针对GLM-5稠密计算与稀疏激活交错并存的MoE特性,中昊芯英采用面向稀疏计算的算力协同优化架构,在提升算力利用率的同时,确保模型在处理复杂Coding任务时的训练吞吐率与收敛效率。
·自适应片上网络:打通大模型负载通信高速路
大模型推理的延迟往往受限于片上通信。中昊芯英通过自适应片上网络通信架构,引入动态低延迟路由算法与网络状态感知机制,有效解决了大模型负载下的通信效率瓶颈。这使得“刹那®”芯片在驱动GLM-5执行长程Agent任务时,能够保持极高的链路利用率与通信稳定性。
·分布式执行环境:实现多级并行的高效调度
为了让GLM-5在服务器集群上实现线性扩容,中昊芯英构建了面向AI指令体系的分布式编译及执行环境。该技术支持节点间、设备内及指令级的多层次并行调度,通过融合静态图稳定性与动态图灵活性的混合建图策略,为GLM-5形成端到端的高效执行路径,确保模型在异构平台上的原生高效运行。
GLM-5擅长处理复杂系统工程与长程Agent任务,而中昊芯英的TPU AI芯片与计算平台为其提供了坚实的算力底座。通过“自研TPU芯片+超算集群+顶级大模型”的深度协同,双方正在共同为客户提供极具竞争力的AI软硬件解决方案。
中昊芯英“刹那®”TPU AI芯片对GLM-5的Day0适配,再次印证了TPU芯片“ForAI”专用架构在AIGC时代的先进性。未来,中昊芯英将继续坚定TPU技术路线,聚焦AI计算本质,并通过深化与智谱AI等顶尖合作伙伴的生态共建,为全球客户提供具备生产力变革能力的AI创新方案。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
中国牵头全球首个自动驾驶世界标准 L3/L4上路新阶段
2026年6月,联合国世界车辆法规协调组织通过全球首个自动驾驶技术法规,由中国等多国共同牵头。法规明确L3 L4级系统安全要求、全生命周期管理及测试方法,将于同年7月生效。中国同步推进强制性国家标准,衔接国际规则,推动自动驾驶进入合规新阶段。
当贝耳机Air 1正式发布,AI软硬件一体化全面落地
提到当贝,许多人首先想到的便是“大屏”这一关键词。 这一点并不难理解。从服务超两亿用户的软件生态,到“每卖出两台激光投影,就有一台是当贝”的市场份额,这家智能科技企业在客厅场景中的影响力已十分稳固。然而,当贝的愿景显然不止局限于客厅。近期,当贝正式发布了其首款AI耳机——当贝耳机 Air 1。这绝非
万元起 杜卡迪全新揽途Multistrada V4 Rally上市
杜卡迪全新揽途MultistradaV4Rally上市,起售价23 8万元。搭载V4Grandturismo发动机,标配自动降低装置、Skyhook悬挂及前后雷达,兼顾长途探险与运动性能。翡翠绿版限量10台,售价24 1万元。
美团CEO王兴自公司成立从未卖股且无计划
在6月26日的美团股东大会上,CEO王兴放出了一个相当直白的表态:从公司成立至今,他个人手里的股票一股都没卖过,而且未来也没有任何减持计划。这话放在当前的市场环境下,分量不言而喻。 王兴还专门解释了去年那笔备受关注的股票转让——2024年他将个人持股的10%捐给了一家基金会。他强调,这完全是出于公益
芯明与钧舵机器人正式启动战略合作 深度融合生态共进
1月22日,钧舵机器人与芯明智能等企业签署战略合作协议,旨在从芯片级到系统级融合机械结构、感知与控制算法,打造低成本、高灵活性的智能末端执行器,推动具身智能生态共建。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-07-05 14:36
2026-07-05 14:36
2026-07-05 14:34
2026-07-05 14:34
2026-07-05 14:34
2026-07-05 14:34
2026-07-05 14:33
2026-07-05 14:33
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

