数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI资讯

热点详情

昇腾为Agent铺好硬件到软件全栈路

AI热点日报时间：2026-05-30

热点解读

昇腾为迎接Agent时代，从硬件到软件全面重构算力底座。超节点实现全域内存统一编址，通信时延降至3微秒；软件全面开源开放，多路径算子编程体系降低开发门槛；开发者体验通过Skills体系和Agentic工作流大幅提升效率。系统重构旨在让算力天然亲和Agent。

要说中国大模型的发展进程，近两年确实令人刮目相看。从去年开始，头部模型的能力已稳定跻身全球第一梯队。M2.5、K2.5等模型在OpenRouter上的Token消耗量长期位居前列，而V4也常被拿来与GPT-5相提并论。但很多人忽略了一个核心前提——这些模型之所以能够“跑起来”，依赖的是现有算力底座“勉强够用”。

那么，何时“够用”会转变为“不够用”？答案就藏在Agent时代。而且到了这个阶段，“能跑”与“跑得顺畅”，完全是两个概念。

在今年的鲲鹏昇腾开发者大会2026——昇腾AI开发者峰会2026上，昇腾揭示了一个底层量化洞察：过去一年，模型调用频次激增了50到100倍，序列长度从Chatbot时代的4K一路攀升至接近1M，跨度高达250倍。更关键的是，MoE推理对时延的要求日趋严苛，正从10毫秒级别向1毫秒级别逼近。

这并非“模型变大了”这类量变问题，而是一个质变信号——整个算力底层的逻辑都需要被重写。因此，真正的问题不是“现有算力够不够”，而是当Agent的胃口以指数级增长，不仅消耗更多资源，还在创造井喷式的新需求时，现有算力架构的“够用”还能持续多久？

从这个视角出发，你会发现，昇腾今年在峰会上阐述的三件事——超节点架构创新、软件全面开源开放、开发者体验升级——本质上都在回应同一个问题：算力底座如何从“能跑模型”进化到“天然亲和Agent”？

这不是三个独立议题。而是从硬件到软件再到开发者的一条完整技术链，必须在Agent前夜完成的一次系统性重构。

超节点：让几千个NPU之间拧成一股更强的力量

Chatbot时代，序列长度约为4K，KVCache命中一次即可，NPU之间的通信压力不大，基本可控。

但进入Agent时代，推理链路被拉长到接近1M tokens，KVCache需要频繁地在不同NPU之间跳跃。此时，问题已不仅仅是“带宽够不够”，而是一个架构级命题——NPU之间的通信方式，直接决定了系统的最终表现。

传统方案是：每个NPU挂载独立内存，跨NPU访问需走消息语义，即send/recv那一套，单次通信耗时在微秒级别。

而昇腾的超节点天然亲和Agent负载。判断超节点的核心标准其实只有一个——是否实现了“全域内存统一编址”。在这方面，昇腾950芯片的架构创新，实现了SIMT与SIMD双编程模式的一体化融合，并在三件事上同时达成了这一点。

第一是内存语义的革命。基于灵衢互联协议和总线控制器，AIC/AIV通过MTE指令直接访存远端内存，完全无需拷贝。对比传统以太网，在超节点架构下，MTE指令一个操作即可完成。这中间的差距，不是量的优化，而是质的重构。

第二是全域内存统一编址。在全局单一虚拟地址空间下，NPU和CPU可直接使用虚拟地址访问任意位置，无需改代码、无需路由、无需拷贝。KV Cache实现全局共享，超长上下文可以无缝扩展。

第三是内存池化带来的效率跃迁。通过片上内存和DDR的分层池化能力，实现“以查代算”，KV Cache查询命中率大幅提高。在LLM、推荐、Engram等典型场景，查询时延降低了3到4倍，训练和推理吞吐相比传统集群提升了3到4倍。

这三层叠加下来，通信RTT时延被压缩到3微秒，带宽更是达到了TB级。这才是超节点的真正价值——不是“堆砌更多NPU”，而是让每一个Token都更高效、更经济。

因此，本次峰会给出的核心判断很直接：互联能力决定超节点能力，系统综合性能取决于超节点规模与单芯片性能规格的乘积。当互联带宽达到T级，超节点要做的不是“堆更多NPU”，而是重新定义芯片之间的通信方式。

但物理上限只是入场券。真正决定算力生态命运的，是硬件造出来后另一个核心问题：软件的门槛有多高？开发者是否愿意加入？

昇腾要走自己的路

吸引开发者的关键在于开源。但开源的底层逻辑，已经发生了转变。

过去很多硬件的所谓“开源”，其实是在围墙外开一扇窗——你能看到代码，但不能修改核心层，更不能参与路线决策。这是“开放姿态”，而非“开源生态”。为什么要在意这个区别？因为开源和“看上去像开源”，打开的是两种完全不同的生态前景。

真开源意味着开发者敢在你平台上持续投入——代码他能改、路线他能参与、技术迭代更新不会在某天突然停止。假开源则意味着他永远得留一条退路，做的每一行优化都可能白费。而在Agent时代，当软件需求开始井喷、新场景以周为单位涌现，开发者选择哪个生态来构建基础设施，本质上是选择信任——信任这个平台不会因为封闭而让他走回头路。

因此，“开放姿态”能吸引围观，“开源生态”才能留住人。

正因如此，昇腾这次在开源开放的道路上走得更彻底。核心区别在于，它正在构建一个完整、高效、开放的算子开发体系，让开发者无论从哪个入口进来，都能找到自己的路径。

追求极致性能的工程师，可以用Ascend C做细粒度控制——计算、访存、流水，每一步都可调。同时，昇腾还推出了Tensor API、支持Host-device混合编程、新增了CCU通信能力。

注重快速创新的AI算法工程师，则可以用TileLang或Triton——这两个主流开源生态接口已实现100%兼容，性能达到Ascend C的0.6到0.9倍，开发周期压缩到一周。目前，已支持超过600个Triton算子和300个TileLang算子。

当然，想在性能和效率之间找到甜点区的开发者，还有PyPTO可选。

在这套多路径算子编程体系的另一侧，CANNBot算子智能体则将“最后一公里”也打通了。它将微架构优化经验融入技能库，单个Vector算子生成仅需3小时，从生成到部署全流程只需1天，相比传统人工开发效率提升了5倍以上。再加上覆盖22类典型算子的评测集和内置了4000多个评测点的自动化验证体系，开发者完全无需从零摸索。

以上这些，加上AscendNPU IR编译底座的全面开源、联合30余家企业与高校共建的15个以上生态算子库，昇腾正在向外界抛出一个关键的橄榄枝——在这里，从零写一个算子，已经不需要“专家身份”了。

从另一个角度来看，开源真正的分水岭，从来不是放出了多少代码，而是开发者能否在昇腾上从头写一个算子。而现在，答案开始变成了“能”。

当然，开了门是一回事，让人留下来又是另一回事。这取决于第三个维度——开发者体验。

开发者体验的飞轮，已经全面转了起来

过去，一个模型从想法到部署的路径是：调研生态兼容性、手工适配算子、搭建验证环境、手动量化、部署调试……整套流程下来，周期往往需要按周计算。而且每一步都需要全方面的能力，而“全方面”就意味着高门槛。

但在DeepSeek-V4-Flash的昇腾实际部署中，我们看到了不一样的路径——1分钟完成模型状态检索，一天内完成适配，再经过小时级的自动验证和量化后，30分钟就能输出部署服务和模型文档。相比传统手动方式，效率提升了4倍，如果考虑环境差异因素，则远远不止4倍。

这是如何实现的？并非工具变多了，而是昇腾将“专家经验”转化成了“系统能力”。

具体来看，有两套机制在驱动这一变化。

第一套是Skills体系。4000多名昇腾工程师多年调优积累的经验、踩过的坑、验证过的最佳实践，在这里被结构化沉淀为200多个可调用的Skills模块。它们兼容Claude Code、Codex、OpenClaw等主流Agent平台，两行命令即可调用。以前需要找对人才能解决的问题，现在Skills里直接就有。

第二套是Agentic工作流。如今，开发者只需描述意图，7个基础Agent会自动编排接力，调研、适配、优化、部署全流程自动化。以前是“人找工具”，现在成了“工具找人”——昇腾从根本上改写了开发者的工作范式。

以上更多是从技术层面来提升开发者体验。但要让开发者体验的飞轮全面转起来，光靠技术还不够。昇腾又进一步推出了两套新体验。

一是零成本的试错空间。一键自动部署、平均两分钟跑通首个Demo、上万卡算力资源投放支撑开源社区——这里要解决的不仅是算力成本，更是“第一次尝试”的心理门槛。很多开发者不是不想用新平台，而是担心花了时间还跑不通。昇腾把“试一试”的成本大幅降低，本质上就是在消除这个心理阻力。

二是可兑现的职业回报。联合头部互联网企业打造三层认证体系，附带简历推荐、大厂实习等权益。昇腾正在让“我能用好昇腾”这件事本身具有商业化的职业流动性。开发者留在一个生态里，从来不只是因为工具好用，而是因为他在这里积累的技能能换取实打实的外部回报。正视这一需求，远比想象中重要。

这两样东西叠加之后，传递给开发者的信息就很清晰了：来昇腾，不需要从头开始。不管是对于开发者，还是对于昇腾，飞轮已经全面转起来了。

写在最后

在超节点巅峰对话直播中，我们看到了一个来自产业端的判断：“当智能生产软件的方式变得更高效，人类对软件的需求会井喷。以前的软件太昂贵，很多需求被压抑了。”

对应来说，Agent时代不仅在消耗更多Token，它还在创造过去根本不存在的新需求——软件不再是标准化产品的复用，而是每个人、每个场景的即时定制。这种需求一旦释放，对算力的渴求就不再是线性的，而是爆炸式的。正如Anthropic联创Jack Clark的判断，2028年Agent可能进入自主进化，届时Token消耗将进入非线性增长通道。

两条线指向同一个结论：Agent时代的到来不能等待。你不可能等Agent全面爆发之后再补架构的课、开软件的源、降开发者的门槛——那相当于堵车的时候才开始修路。

因此，回过头来看昇腾在峰会上铺开的三件事，本质上是对这一判断的三重回应。

首先，超节点重新定义了NPU之间的通信范式，让Agent时代的算力消耗不再被延迟墙锁死。这是为Agent时代奠定硬件基础。

其次，CANN的多路径算子编程体系加CANNBot，让任何一个开发者都能在昇腾上从零写出高性能算子。这是为Agent时代夯实软件能力。

最后，Skills体系和Agentic工作流，把4000个工程师的经验打包成每个新手的起点。这是为开发者铺好“好用易用”的路径。

三道能力叠加在一起，也就解释了昇腾今天要做的事——不是在应对当下，而是在对标一个还没到眼前、但已在路上的Agent时代。

热点追踪提示词

你是一名 AI 行业编辑，请围绕下面这条热点输出一份资讯解读：
热点：昇腾为Agent铺好硬件到软件全栈路要求：
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题

来源：https://www.ofweek.com/ai/2026-05/ART-201714-8460-30689025.html

人工智能

上一篇：Anthropic提出Contextual Retrieval，大幅降低RAG检索失败率

下一篇：如何让手机拥有视觉感知能力详细教程首发

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。