NVIDIA发布Spectrum-XGS以太网:连接多地数据中心,重塑AI网络性能边界

面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,以更强的算力赋能AI技术的发展。
从PERCEPTION AI到AGENTICAI,再到PHYSICAL AI……人工智能技术的飞速演进和发展,在重构企业业务模式,加速企业转型的同时,也给算力带来了巨大的挑战。目前,单GPU算力已无法满足指数级增长的计算需求,当万亿参数模型需要跨数千张GPU协同训练时,网络性能成为决定整体效率的核心瓶颈。
面对AI工作负载下传统以太网在带宽限制、延迟波动和丢包等问题暴露出的致命缺陷,NVIDIA推出了Spectrum-XGS以太网技术,将不同城市、国家乃至大洲的数据中心组合成庞大的千兆级AI超级工厂,以更强的算力赋能AI技术的发展。
跨数据中心整合的"超级计算机"模式
NVIDIA Spectrum-XGS的核心创新在于突破传统数据中心边界,通过高速以太网将多个地理位置分散的数据中心连接为一个逻辑统一的计算单元。而这一创新的技术架构模式,彻底解决了AI训练中数据分布广,算力需求动态变化的难题。
据了解,NVIDIA Spectrum-XGS提供跨地点扩展与纵向扩展和横向扩展的能力,并称AI计算“三大支柱”,能够将Spectrum-X以太网的极致性能和规模扩展至多个分布式数据中心,将它们组成具有千兆级智能的巨型AI超级工厂。
除此之外,NVIDIA Spectrum-XGS以太网完全集成于Spectrum-X平台,具有使网络能够动态适应数据中心设施间距离的算法。 据了解,凭借先进的自动调节距离拥塞控制、精准延迟管理及端到端遥测技术,NVIDIA Spectrum-XGS以太网将NVIDIA集合通信库性能提升了近一倍,加快了多GPU和多节点通信速度,使分散在不同地点的AI集群性能变得可以估测。这样就可以将多个数据中心组合成一个AI超级工厂运行,全面提升长距离连接性能。
在性能方面,NVIDIA Spectrum-XGS通过优化集体通信库(NCCL),多站点部署下的性能提升达1.9倍,显著缩短万亿参数模型训练的同步周期。
在笔者看来,NVIDIA Spectrum-XGS的优势在于,其通过高速网络将位于不同地域数据中心中的数以万计的GPU进行统一编排,构成一个超大规模的计算单元,为AI提供了强大的算力支持。同时,克服了本地建设超大规模数据中心所需要的电力成本和物理限制。据悉,NVIDIA Spectrum-XGS所采用的分层高速设计不但能够提供更高的带宽,而且还提供更加可靠灵活的扩展能力。
数据显示,AI超级高速公路现已融入机架,GPU到GPU的带宽高达每秒130TB,并通过NVLink实现全连接。
另据介绍,NVIDIA正在通过NVLinkFusion的成熟架构实现性能扩展,其中NVLink的硬件和软件传承提供了领先的扩展性能,而NVLink Fusion提供了唯一可量产的机架级、可扩展的连接结构,并在模块化组合产品方面具有全面性和灵活性。
NVFP4:引领4位训练的新前沿
除了Spectrum-XGS之外,NVIDIA还重磅宣布推出NVFP4,进一步引领4位训练的新前沿。
NVFP4以更高的效率实现了BF16级别的精度,证明4位预训练已准备好用于大规模人工智能。人工智能(AI)工厂可以使用NVFP4来加速训练和推理,从而加快开发并简化部署。
据了解,NVFP4在预训练方面的应用正通过与领先的AI组织持续合作进行积极探索。
开源创新重塑人工智能
在开源方面,NVIDIA以1000多个GitHub项目、450 多个模型和80 多个数据集推动开源发展。
据介绍,NVIDIA Dynamo 使Hopper 上的 [lama 推理速度翻倍,并且在Blackwvell 上显著提升 DeepSeek-R 的令牌吞吐量,在 Blackwell上为DeepSeek-R 实现的吞吐量提升。
除此之外,NVIDIA还积极参与到Linux、PyTorch、Python、Kubernetes、ROS、JAX等社区当中,为社区发展做出了重要的贡献。
最后,在CUDA-X中,400 多个 GPU库为大规模的人工智能、高性能计算、数据和机器人技术提供支持。据了解,NVIDIA的模型和数据集涵盖语言、视觉、多模态和机器人领域,包括Llama、NeMo、Cosmos、GROOT等。
写在最后:
面对高速发展的AI技术对算力提出的新挑战,NVIDIA凭借Spectrum-XGS以太网再次证明,真正的创新不仅在于硬件性能的提升,更在于通过系统性架构设计。Spectrum-XGS的推出,与Blackwell架构GPU、DGX SuperPOD超算系统形成端到端解决方案,不仅提供了更强的算力,而且降低了客户的集成成本。不难发现,当千兆级人工智能超级工厂成为现实,我们正见证一个新计算时代的诞生。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
最新文章
CDimension横空出世:立志从底层重建芯片技术栈
随着人工智能、机器人、量子计算与边缘计算等新兴应用对算力提出更高要求,传统硅基架构在能效、封装碎片化及带宽瓶颈等方面的物理极限日益显现。CDimension 正以一种根本性不同的技术路径,力图突破这
小米发布REDMI 15C:百元神机来袭,配置亮眼性价比高
小米近日在多个海外市场推出旗下最新入门级智能手机REDMI 15C,起售价为119美元,折合人民币约849元。作为小米旗下价格最为亲民的手机系列,该产品线历代机型均以高性价比著称,被许多用户称为百元
安富利:30载深耕中国市场,长期主义构筑可持续发展护城河
在安富利,我们始终坚信,ESG(环境、社会、公司治理)是驱动企业实现长期可持续发展的核心竞争力。 管理大师德鲁克曾说:“企业是社会的器官,任何企业得以生存,都是因为它满足了社会某一方面的需要,实现了
务必自查:Linux 爆出本地双杀提权漏洞,从 SSH 到 Root 只需一步?
这两个漏洞组合形成了从普通账号到 root 的完整提权链条,运维工程师们不能掉以轻心,引起足够重视,记得做好提前备份。 今天分享两个6月17号Qualys研究团队披露了公布的Linux漏洞。1 漏
国产动作游戏跻身日本销量榜前十,多款新作表现亮眼
跻身日本销量榜前十,多款新作表现亮眼 " >上周日本地区游戏销量排行榜正式公布,其中一款国产动作游戏失落之魂成功进入前十,引发广泛关注。在本期榜单前十名中,共有七款新作首次进入排行榜,若按不同平台合并
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程



















