当前位置: 首页
AI
AI原生时代来临,商汤大装置如何重塑算力集群架构

AI原生时代来临,商汤大装置如何重塑算力集群架构

热心网友 时间:2026-04-07
转载

近日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

商汤大装置首席架构师项铁尧受邀出席研讨会,并发表《商汤大装置AI原生云基础设施探索与实践》主题演讲,系统阐述了商汤大装置对AI原生时代算力集群建设的前沿判断与实践路径——如何将软硬件能力真正转化为客户可用、易用、高效的算力服务。

在他看来,当算力集群的发展进入AI原生时代,新的架构范式应具备统一的规范、极致弹性的扩缩容机制以及为大模型训练和推理深度优化的AI集群runtime。



01. AI算力池:面向角色、水平分层、资源自由流转

项铁尧从底层技术视角切入,指出Kubernetes(全球最流行的容器编排平台)正朝着AI方向发展。

随着动态资源分配(DRA)、Workload API与Gateway API三项核心新特性的引入,K8s逐渐从简单的容器编排工具,进化为AI时代的操作系统。这背后,其实是整个行业在加速从云原生集群时代向AI原生时代跃迁。

围绕上述转变过程,项铁尧重点介绍了商汤大装置前瞻打造的核心产品——AI算力池。

据了解,AI算力池面向AI原生时代全新算力服务需求,采用"三明治"水平分层架构,从底层高度优化的计算网络存储基础设施,到中间层全新的虚拟集群技术,再到上层涵盖开发机、训练平台、部署平台及Agentic Engine的完整PaaS产品体系,全面杜绝不同产品之间的资源孤岛问题。



其中,大装置AI算力池具备三大优势:

1)面向角色。面对客户内部角色多元、需求复杂的现实,分别设计服务形态、提供差异化的解决方案。比如针对集群管理员与平台工程师提供高弹性虚拟集群资源;针对AI研究员,可提供丰富的脚本工具与高效研发环境等等。

2)水平分层。AI算力池采用“三明治”结构,杜绝产品间信息、资源孤岛的可能。

3)资源自由流转。用户只需购买一种通用算力形态,即可在虚拟机、虚拟集群、AI Code Space开发机等不同产品形态之间秒级自由切换,充分应对国内普遍存在的算力潮汐效应,大幅提升集群整体资源利用率。

02虚拟集群:全量托管,秒级弹性扩缩容

值得一提的是,在底层Infra层,商汤大装置创新应用虚拟集群技术,解决了传统云托管服务中“数据面管理重、扩容慢”的痛点。

有别于主流云厂商仅托管控制面,数据面仍需用户自行管理的传统模式,全新的虚拟集群技术,实现了控制面与数据面的全量托管,扩缩容效率从传统方案的数分钟乃至数十分钟压缩至秒级,同时提供完全标准的K8s API,用户无需对现有代码做任何修改即可无缝接入。

03三大自研套件:护航超大规模AI训练与推理

在虚拟集群基础上,项铁尧进一步提出AI集群Runtime产品概念。

“要快速搭建一个离线混部、训练推理混合使用的集群非常复杂,因为现在AI新的技术层出不穷,各种组件之间协同优化同样复杂。”项铁尧指出,“为了解决这种难题,我们通过智能推荐、深度调优与版本锁定机制,帮助用户快速搭建复杂的在离线混部、训练推理混合使用集群,降低AI基础设施的使用门槛与运维复杂度。”

为了进一步满足超大规模AI生产场景的极致性能需求,商汤大装置还自研了三大套件:

1)SenseCore Scheduler:高性能调度器,支持复杂异构硬件的在离线混合调度。

2)容错引擎:解决超大规模训练中的不稳定性,实现故障自动检测与隔离。

3)Agentic Engine:针对不断涌现的Agent使用需求,进行深入优化,包括沙箱预热、快速启动、规划保持、状态快照等。

04虚拟节点:打通弹性算力最后一环

为了以更灵活的规格为客户提供算力资源,商汤大装置同步自研虚拟节点技术,它具备三大优势:

1)虚拟集群体系无缝集成;

2)提供相比于虚拟机更轻量级的使用体验以及更高效的性能;

3)提供相比于runc更好的安全性和隔离度。

05生态合作,共同助推国产推理基础设施迭代

演讲中,项铁尧还特别感谢九源智能计算系统生态联合体与生态伙伴趋境科技。

目前,商汤大装置已与趋境科技展开深度合作,为趋境科技自研的ATaaS高效能AI Token生产服务平台提供高性能、高可靠的算力支撑。

据了解,趋境ATaaS高效能AI Token生产服务平台可支撑万级别AI推理需求,并达到日均万亿级别Token整体产能。

在生态联盟层面,商汤大装置作为九源智能计算系统生态联合体理事单位,积极参与这一以"产学研用服"协同合作为核心模式的开放生态。

该联合体聚焦国产智能计算系统建设、软件生态统一与技术成果转化,致力于构建自主可控的智能计算产业生态。商汤大装置加入其中,希望以自身在AI基础设施领域的积累,为整个生态贡献实质性力量,推动AI能力真正走向普惠。

未来,商汤大装置将进一步联合生态伙伴,共同推动国产推理基础设施迭代升级,为我国人工智能产业高质量发展、新质生产力落地提供坚实支撑。

转载来源:商汤科技

来源:https://www.163.com/dy/article/KPHFL5TT0511DSSR.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
00后交大博士造飞行机器人,融资超千万,交大投了

00后交大博士造飞行机器人,融资超千万,交大投了

机器人前瞻(公众号:robot_pro)作者|葛文婷编辑|漠影机器人前瞻4月3日报道,昨日,专注于具身智能仿生扑翼机器人的鹰瞰智翼宣布完成天使轮融资,累计融资金额达数千万元。据悉,该公司已在一年内连

时间:2026-04-07 12:07
对话特赞范凌:我亲手「杀死」了过去的自己,AI 时代所有的留恋都是负担

对话特赞范凌:我亲手「杀死」了过去的自己,AI 时代所有的留恋都是负担

当所有人都能调用 AI 时,什么才是你真正的护城河?作者|周永亮编辑|郑玄「我不知道 AI 这艘船上有多少船票,但我知道,上船最重要。」特赞科技创始人兼 CEO 范凌的紧迫感,几乎一直弥漫在整场交流

时间:2026-04-07 12:01
机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法

机器人舞姿爆红背后:具身智能行业“卡脖子”难题,终于有了新解法

头图由智象未来AI大模型生成智东西作者 王涵编辑 漠影在演唱会、各大晚会的舞台上,机器人伴舞团以整齐划一、精准卡点的舞姿惊艳全场。这种整齐划一不仅是硬件的胜利,更是“训练有素”的结果。具身智

时间:2026-04-07 11:55
最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑

最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑

智东西编译 陈佳编辑 程茜智东西4月3日消息,今日谷歌DeepMind开源发布Gemma 4系列模型,根据最新博客,这是谷歌迄今为止最智能的开放模型,专为高级推理和智能体工作流而设计,实现了单位参数

时间:2026-04-07 11:49
OpenAI收购了一家脱口秀公司

OpenAI收购了一家脱口秀公司

henry 发自 凹非寺量子位 | 公众号 QbitAI什么?拿下史上最大融资的OpenAI,反手了收购一个视频播客?刚刚,OpenAI宣布收购「科技脱口秀」TBPN,目标是加速全球围绕AI的交流。

时间:2026-04-07 11:43
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程