新华三AI基础设施如何从力大砖飞迈向拟态共生

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

新华三AI基础设施如何从力大砖飞迈向拟态共生

热心网友时间：2026-05-15

转载

过去几年，Scaling Law（规模定律）深刻定义了人工智能行业的发展路径：通过持续增加算力、扩充数据、扩大参数规模，以换取模型智能的涌现。

随着AI智能体（Agent）时代的到来，产业对算力的需求重心正从大规模预训练转向高频次推理，海量的Token消耗从根本上重塑了基础设施的评价标准。在“Token经济学”的框架下，竞争焦点开始向更低延迟、更高能效和更优成本倾斜。

当单纯扩大模型与集群规模带来的边际收益开始递减，整个行业亟需回答一个核心问题：如何在有限的能源、空间与数据边界内，实现更高密度的智能产出？

在近期举行的NAVIGATE 2026领航者峰会上，新华三集团技术委员会副主席刘新民给出了明确方向：AI基础设施的竞争，正从单一的硬件参数比拼，全面进入以系统重构与架构创新为核心的“系统工程竞争”新阶段。

01 超越“参数崇拜”：从“设备思维”到“系统思维”的跃迁

在全行业竞相追逐参数规模与硬件指标的背景下，刘新民提出了一个引人深思的悖论：“既然单设备参数如此强大，为什么实际部署时仍然需要复杂的系统调优？”

这个问题，恰恰揭示了AI时代最根本的产业变革逻辑。

在传统ICT领域，评价设备能力的逻辑相对直接，主要比拼CPU主频、网络带宽、存储IOPS、单机吞吐量等静态性能指标。业界曾普遍认为，只要将最顶级的算力卡、最高速的无损网络和最大容量的存储设备连接在一起，就能释放出最大的整体效能。

然而，在大模型推理的实际场景中，Token的生成是一个高度依赖动态协同的过程。即使每个单体硬件的性能指标都达到顶尖，如果底层架构的数据流转路径存在阻塞或调度低效，运行大模型时依然无法达到“行云流水”的顺畅状态。硬件的堆叠仅定义了理论性能上限，而深度的、系统级的工程化能力，才真正决定了将理论算力转化为实际生产力的效率。

为什么传统的“设备思维”模式在AI时代难以为继？刘新民在演讲中指出了三个结构性的“剪刀差”矛盾。

首先是数据供给与需求的“剪刀差”。

当前互联网上的高质量文本数据已接近枯竭，而大模型对高价值、可信语料的需求仍在爆炸式增长。在数据孤岛普遍存在、合成数据质量参差不齐的现实约束下，核心矛盾已不是数据总量不足，而是缺乏足够可信、可用、高质量的数据。

其次是算力增长与架构瓶颈的“剪刀差”。

随着芯片制程工艺无限逼近物理极限，摩尔定律的放缓已成为不争的事实。更为关键的是传统冯·诺依曼架构固有的“内存墙”问题——在大模型的训练与推理过程中，超过95%的计算时间被消耗在数据搬运上，而非用于实际的计算操作。

最后是能源需求与供给的“剪刀差”。

AI算力需求翻倍的时间周期已缩短至一年以内，而传统电网等能源基础设施的规划与扩容周期往往需要5到10年。能源的线性供给速度，很可能永远无法匹配AI功耗需求的指数级增长曲线，单纯依靠硬件扩容必将遭遇一道道坚实的“能源墙”。

这三个难以逾越的“剪刀差”，共同揭示了一个核心事实：算力底座的下一代进化，绝非某个单一技术点的优化，而必须是一场全局性、系统性的架构革命。

刘新民分享了一段内部实践经历：“我们早期的一个AI解决方案，从纸面配置、参数指标到理论方案都非常出色，但在实际市场比拼中，总感觉竞争力差一口气。后来团队沉下心来，花了近半年时间，重新深挖每一个系统细节：设备如何组合部署、网络拓扑如何优化、数据链路如何调度、计算资源如何动态分配，甚至细化到系统每一个层级间的协同效率。最终我们发现，真正拉开差距的，并非多配置几张显卡，而是隐藏在整套系统背后的深度工程化整合能力。”

作为ICT领域的务实派，新华三以自身实践印证了这一趋势：AI基础设施的竞争，已经彻底从“设备思维”转向“系统思维”。唯有将复杂系统调校至协同最优状态，才能真正将纸面算力转化为客户可感知的生产力提升。

02 突破性能瓶颈：构建“算—存—云”三位一体的新一代算力底座

回归到当前最紧迫的产业课题：面对海量Token消耗带来的成本与效率压力，如何系统性解决算力体系普遍存在的性能与能效瓶颈？

刘新民的答案是：“真正的算力底座绝非硬件的简单堆叠，而是通过深度的系统重构与前瞻的架构创新，构筑起支撑智能体高效、稳定运行的坚实基座。”为此，新华三正致力于打造“算力、存储、云智”三位一体深度融合的算力底座。

深入剖析，这套新型底座的构建主要依托于四大核心能力支柱。

第一，极致的硬件工程与集成能力。

在避免盲目“堆硬件”的理念下，新华三在硬件集成设计上实现了突破：通过创新主板布局、小型化设计、冷板共用等工程技术，在标准的1U机架空间内成功集成了6颗高性能CPU，实现了“一柜抵五柜”的超高密度效果。为确保超高密架构的长期稳定运行，新华三还推出了业界首个实现量产的全液冷整机系统，达成了100%全液冷散热，极大提升了能效比。

第二，面向AI场景的极致存储与数据加速能力。

在推理阶段，Token的生产成本与延迟主要取决于数据流动效率。新华三的解决方案是面向AI工作负载进行全栈存储优化：例如，通过AI算法实现智能缓存预取，显著提升了缓存命中率与数据读取性能；通过创新的KV Cache加速技术，有效打破推理任务中的显存容量限制与数据访问瓶颈，使得Token生成的首字时延降低高达90%，重复IO请求节省80%。

第三，云智深度融合的调度与优化能力。

通过“通智融合”架构与“一云多芯”策略，新华三实现了对异构算力的统一调度、资源池化与高效复用，可保障业务在十万节点规模下持续稳定运行。同时，其自主研发的智算加速引擎，将跨节点通信时延降低了50%，并利用算子融合与内存池化等软件技术，打破了单卡显存容量瓶颈，将大模型推理效率整体提升了20%。

第四，开放多元的算力生态融合能力。

面对业界GPU种类繁多、互连标准不一的现状，新华三以开放系统架构为核心，通过构建异构算力生态、算力互联生态与融合软件生态，打造了多元开放的算力体系。其目标是实现多厂商GPU的平滑接入与统一协同管理，推动算力与网络的深度融合，最终为千行百业的客户提供更灵活、高效、性价比最优的算力配置方案。

新华三的整体思路清晰而务实，可以用一句话概括：通过超高密集成与全液冷设计最大化硬件性能与能效；利用高性能存储与KV Cache加速突破数据访问瓶颈；依托“通智融合”的智能调度与超融合技术优化资源利用率；最终以开放的多元算力生态，实现全域资源的池化、聚合与高效供给。

需要强调的是，新华三并未止步于蓝图规划，而是通过一系列量产产品加速理念落地：

例如，兼容多CPU平台、可适配超百款AI加速卡的R5500 G7X模组化服务器，其单卡算力功耗释放比上一代提升了42%；面向智能计算场景的X10000系列XCache推理加速系统，可实现KV多级缓存卸载，在同等算力投入下将用户并发支持能力与Token产出效率提升高达10倍；UniPoD S80000系列超节点产品，单个1024卡超节点可通过Scale-Up纵向扩展至16384卡，同时支持构建73728卡规模的超大规模集群……

刘新民在对话中多次强调：新华三的终极愿景，是通过系统级的深度重构，实现“从每一瓦电力消耗到每一个Token产出”的全链路效率最优。