当前位置: 首页
AI资讯
上海仪电等联合发布国内首个光互连光交换GPU超节点光跃

上海仪电等联合发布国内首个光互连光交换GPU超节点光跃

热心网友 时间:2026-05-28
转载

【2025年7月28日,上海】在2025世界人工智能大会“智算云启,共绘生态”论坛上,一项标志着国产智算集群架构进入新阶段的重大成果正式发布。上海仪电携手曦智科技、壁仞科技、中兴通讯,共同推出了国内首个光互连光交换GPU超节点——光跃LightSphere X。该超节点集成了多项前沿技术:基于曦智科技全球首创的分布式光交换技术,采用硅光工艺的光互连光交换芯片,结合壁仞科技自主原创架构的高算力通用GPU液冷模组及全新载板互连,同时搭载中兴通讯的高性能国产AI服务器以及仪电智算云平台软件。其目标是构建一个高带宽、低延迟、灵活可扩展且自主可控的智算集群新范式,并计划近期在上海仪电智算中心完成落地部署。

光跃LightSphere X发布仪式现场

创新技术直击算力与网络核心痛点

当前,万亿参数大模型与多模态训练的快速发展,正将算力集群推向“万卡协同”的深水区挑战。超节点架构通过将GPU资源深度整合,在节点内部构建低延迟、高带宽的统一算力实体,已成为支撑这一演进的关键路径。

面对挑战,行业普遍思路是提升单机柜功耗以塞入更多GPU。然而,数据中心单机柜功耗存在物理上限,这一路径很快就会遭遇瓶颈。光跃LightSphere X另辟蹊径,采用光互连技术,通过增加机柜数量来构建超节点,从而突破传统互连方式的物理限制。与铜缆相比,光缆在远距离传输上的优势使GPU部署可与机柜解耦。这带来的核心价值非常明确:打破单机柜功耗束缚,支持万卡级别的弹性扩展,同时兼容现有数据中心设施以降低改造成本,还能根据实际算力需求动态调整超节点规模,实现分阶段、更经济的建设。

更进一步,光跃LightSphere X搭载的全球首创分布式光交换技术,将超节点的灵活性与可扩展性提升至全新高度,最终目标是提高整个系统的性价比。它与传统集中式交换截然不同,创新之处在于将光交换功能集成到每一块GPU上,从而灵活切换GPU之间的互连拓扑结构。这意味着什么?首先,发生故障时系统可实时重构网络拓扑,保障大模型训练与推理的连续性,同时降低冗余备份带来的GPU成本。其次,系统能根据不同模型的算力需求动态调整超节点规模,切换最优网络拓扑。此外,分布式设计天然支持GPU高带宽通信域的弹性扩展。据悉,光跃LightSphere X将率先实现2千卡规模的部署。

强大的算力是整个系统的根基。光跃LightSphere X得益于采用多计算芯粒与CoWoS 2.5D封装协同设计的GPU模组,其算力基石是壁仞科技自主原创架构的高算力通用GPU液冷模组。通过自研的智算云平台软件灵活配置超节点网络拓扑,系统能高效支持密集通信及更大规模的张量并行与流水线并行,从而灵活适配各类大模型需求,大幅提升节点可扩展性。其OCS UBB采用独创的革新载板设计,凭借超低损耗板材和多层架构,实现了丰富灵活的互联拓扑。这种训推一体的架构可动态分配计算资源,既能满足千亿参数大模型训练的高吞吐需求,又能保障推理任务所需的低时延响应。

当然,硬件之上的软件平台同样至关重要。光跃LightSphere X的智算集群统一管理平台,通过深度融合调度引擎与训练推理框架,实现了对超节点全生命周期的智能管控。平台能依据不同模型特征智能配置最优超节点拓扑,从而显著提升训练性能;基于全局资源可观测体系,实现故障节点的秒级替换与分钟级断点续训,有力保障大规模模型的长稳运行。此外,通过软硬协同的系统级工程优化,进一步释放了超节点在性能与效率等方面的综合潜能。

开放、自主可控生态打造中国智算基础设施新基座

光跃LightSphere X的意义远不止于单点技术创新。它更核心的聚焦点在于构建一个全栈自主的智算生态,旨在为中国未来的算力基础设施筑牢根基,为人工智能的蓬勃发展提供强劲而可靠的动力。

具体来看,这套生态体系体现在三个层面:

硬件层开放兼容:其采用的光交换技术本身不依赖于特定数据传输协议,因此可无缝兼容不同厂商使用的互连协议,从根源上消除了生态锁闭的风险。

突破核心器件与供应链瓶颈:分布式光交换芯片基于硅光技术,其设计与制造并不依赖最先进的半导体工艺节点,为供应链安全提供了重要保障。

全栈软件自主:从资源调度、故障容灾到性能优化,自研的统一管理平台实现了全链路自主管控。

可以说,这套“开放协议+自主技术+自研软件”的协同体系,真正构建了一个从底层技术到上层生态的自主可控闭环。

上海仪电表示,光跃LightSphere X依托上海仪电的坚实算力底座,聚合了国内智算领域多家头部企业的核心能力,共同打造了从“光芯片—GPU—服务器—算力集群—智算云平台”的完整产业闭环,旨在建立一个开放共享的光电融合算力生态体系。展望未来,光跃LightSphere X将作为新一代智算集群的核心架构,支撑全栈自主可控的国产算力池建设,助力中国AI算力基础设施实现跨越式发展。

来源:https://m.elecfans.com/article/6885377.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
修Bug被Gemini追删代码致宕机修复报告现编

修Bug被Gemini追删代码致宕机修复报告现编

最近,一起堪称“教科书级别”的AI Agent IDE翻车事件在开发者社区引发热议。这起事故值得所有依赖AI编程工具的开发者,尤其是那些已经在生产环境中对AI Agent 授予较高权限的团队,进行深刻反思。 简单回顾:5月26日,一位开发者要求Gemini 3 5(运行在Agent IDE环境中)修

时间:2026-05-28 22:58
Notion AI运营指南:自动归纳用户反馈

Notion AI运营指南:自动归纳用户反馈

其实,想在 Notion 中高效搞定用户反馈的自动归纳,并不复杂。下面这四种 AI 方法,基本覆盖了从单条处理到全局分析的常见场景。 如果你也在用 Notion 收集用户反馈——无论是问卷、邮件、客服记录,还是社群发言——但总觉得信息碎片化严重,难以提炼共性问题和核心诉求,那很可能是因为缺少一套结构

时间:2026-05-28 22:54
AI给出的答案为何总不符期望?原因解析

AI给出的答案为何总不符期望?原因解析

大模型能力强大,但提问方式不当会导致结果不理想。核心在于精准提问,通过角色设定、背景介绍、明确任务、实现路径和输出要求这五个关键步骤逐步细化问题,才能大幅提升AI回答的质量和精准度。

时间:2026-05-28 22:54
Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

Anthropic新AI聊天机器人模型声称在多项测试中击败OpenAI GPT-4

2024年3月5日,人工智能领域迎来了一位重要参与者——由OpenAI前员工创立的Anthropic公司正式推出了Claude 3系列模型。这次发布极具分量:新模型不仅在性能上与Google和OpenAI的顶级产品并驾齐驱,部分指标甚至实现超越。要理解此次升级的真正价值,先关注几个关键变化。首先是多

时间:2026-05-28 22:53
Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

Trae对Deno与Bun运行时的AI代码补全支持程度全面详解

如果你在使用 Trae 进行 AI 代码补全时发现,它对 Deno 或 Bun 运行时的提示不够精准——例如类型定义缺失、API 无法正确识别——那很可能不是代码本身有误,而是 Trae 的底层配置尚未适配。简而言之,Trae 对于非 Node js 运行时的标准库支持尚未实现“开箱即用”。下面我们

时间:2026-05-28 22:52
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程