当前位置: 首页
科技数码
OpenAI与英伟达等五大巨头联合发布MRC协议革新AI训练网络架构

OpenAI与英伟达等五大巨头联合发布MRC协议革新AI训练网络架构

热心网友 时间:2026-05-08
转载

5月7日,OpenAI联合AMD、博通、英特尔、微软及英伟达等科技巨头,共同发布了一项旨在重塑AI基础设施网络格局的关键协议——“多路径可靠连接”(Multipath Reliable Connection, MRC)。该协议已通过开放计算项目(OCP)正式开源,其核心目标是彻底解决大规模AI模型训练中网络脆弱、成本高昂的行业共性难题。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

从技术原理上看,MRC协议基于RoCE标准进行扩展,并深度融合了SRv6技术。它致力于应对一个在超大规模AI集群中极为严峻的挑战:当数万乃至数十万块GPU协同进行分布式训练时,任何微小的网络延迟、瞬时拥塞或链路闪断,都可能导致整个训练任务暂停,造成价值数十亿美元的高性能计算资源闲置。传统数据中心网络中可容忍的波动,在AI训练场景下会被急剧放大,集群规模越大,网络可靠性问题就越突出。

那么,MRC协议究竟如何构建高可靠AI网络?其解决方案主要围绕网络架构、流量工程与控制逻辑三个维度展开系统性优化。

架构革新:从复杂分层到扁平化网格

传统超大规模网络通常依赖多层(三层或四层)交换架构来连接海量计算节点,这种结构类似复杂立交桥,存在路径冗长、节点众多、功耗高且单点故障影响范围大的弊端。MRC创新性地采用了多平面网络设计,其核心思想是实现架构的“扁平化”与“资源虚拟化”。

具体而言,该技术能够将一个物理的800Gb/s高速网络接口,虚拟地划分为多个逻辑子链路。通过这种“化整为零”的方式,仅需两层交换机即可高效连接约13.1万块GPU。这种扁平化设计带来了多重优势:网络层级减少直接降低了传输延迟与整体功耗,所需管理的交换机数量也大幅下降。同时,它极大地丰富了网络路径的多样性,为后续实现智能、动态的流量调度奠定了坚实的物理基础。

流量调度:自适应多路径分发技术

在构建了高冗余的扁平网络之后,如何智能地调度数据流成为关键。MRC引入了一项名为“自适应数据包喷淋”的突破性技术。其工作原理非常直观:在进行大规模数据传输时,系统不再将数据流约束于单一固定路径,而是像喷淋头均匀洒水一样,将数据包动态分散到数百条可用的并行链路上进行同步传输。

这种多路径并发传输机制,从根本上避免了传统网络中因流量集中导致的“热点”拥塞问题。用户可能会关心数据包乱序到达如何解决——接收端的GPU能够依据每个数据包内嵌的内存地址标识,高效、准确地将分散到达的数据包重新组装为完整数据流,确保了数据传输的最终一致性。

控制简化:以确定性路由替代动态协议

网络控制平面的复杂性是另一个主要的故障来源。传统动态路由协议(如BGP)在超大规模、低延迟要求的AI计算集群中,暴露出收敛速度慢、行为难以预测等局限性。MRC对此进行了大胆革新:它全面摒弃了动态路由,转而采用基于SRv6的源路由技术。

这意味着,数据包在发送源头就已经被预先赋予了完整的传输路径信息。网络中的交换机无需进行复杂的动态路由计算与协商,只需根据静态配置执行高效的转发动作即可。这种“确定性网络”模型,彻底消除了动态路由协议可能引发的振荡与不确定性故障。其带来的性能提升是显著的:网络在遭遇故障后的恢复时间,从传统的秒级大幅缩短至微秒级。

理论需要实践验证。根据已公开的部署案例,MRC协议已在NVIDIA GB200超级计算机与Oracle Cloud Infrastructure (OCI) 数据中心得到实际应用。在真实的AI大模型训练负载测试中,即便模拟了链路抖动、交换机故障重启等极端场景,MRC也能在训练任务零中断的前提下,实现流量的自动、快速切换与故障规避,确保了计算资源的持续高效利用率。

综上所述,OpenAI携手产业伙伴推出的MRC协议,不仅仅是一项网络通信标准,更是对下一代AI算力基础设施架构的前瞻性定义。它瞄准的不仅是极致的网络性能,更是超大规模系统在持续扩展中所必需的“韧性”与“高可用性”。随着AI模型向万亿乃至更大参数规模演进,此类底层基础设施的创新,其战略意义或许比模型架构本身的微调更为深远和关键。

来源:https://www.techweb.com.cn/it/2026-05-07/2975145.shtml

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
苹果耳机将配备摄像头引领未来科技新趋势

苹果耳机将配备摄像头引领未来科技新趋势

苹果正研发多款AI硬件,包括带摄像头的AirPodsPro(已进入设计验证阶段,可提升Siri交互并设有隐私提示灯)、无屏智能眼镜及AI吊坠。这些设备旨在实现更智能的交互与始终在线的助手功能,被内部视为开启新时代的关键产品。

时间:2026-05-08 10:16
马斯克前女友出庭作证 曾提议奥特曼加入特斯拉董事会

马斯克前女友出庭作证 曾提议奥特曼加入特斯拉董事会

马斯克与OpenAI的法律交锋本周迎来关键庭审。随着新证据不断浮出水面,这场备受瞩目的诉讼案变得愈发复杂,其中一些证据与马斯克此前的证词存在明显出入,让案件的最终走向充满了不确定性。 本周三,与马斯克育有四名子女的希冯·齐利斯出庭作证。她曾担任OpenAI董事会成员,并一度是马斯克与OpenAI管理

时间:2026-05-08 09:44
微信语音消息未读提示变灰功能正在灰度测试

微信语音消息未读提示变灰功能正在灰度测试

最近,不少iOS用户发现了一个小变化:微信里未读语音消息的提示红点,悄悄变成了浅灰色。这个调整目前只出现在部分更新到微信8 0 71及以上版本的iOS设备上,安卓用户暂时不受影响。 针对这个变化,腾讯客服给出了官方解释:这其实是iOS端正在进行的一项“未读模式”功能灰度测试,属于阶段性设计,并非最终

时间:2026-05-08 09:13
杭州技术革新:外骨骼与智慧农业如何拓展人类能力边界

杭州技术革新:外骨骼与智慧农业如何拓展人类能力边界

科技的温度,往往体现在它如何悄然改变个体的命运。今年广交会上,一位来自阿根廷的肌无力患者玛丽亚,借助外骨骼机器人重新站立行走。此前,她的日常出行完全依赖轮椅。当玛丽亚穿戴好智能康复设备,迈出第一步时,身旁的同伴不禁喜极而泣。 这暖心的一幕,让许多人直观感受到:真正的科技创新,是让被剥夺的行动能力与尊

时间:2026-05-08 09:13
美股三大指数集体收跌 ARM重挫超10% 中概股表现疲软

美股三大指数集体收跌 ARM重挫超10% 中概股表现疲软

美股三大指数高开低走,集体收跌。中东局势升级引发市场震荡,投资者情绪谨慎。个股表现分化,英伟达、特斯拉上涨,ARM因高盛看空暴跌超10%。中概股指数下跌1 4%,富途等跌幅显著,新能源汽车股走势不一。

时间:2026-05-08 08:11
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程