AI算力瓶颈凸显:如何突破存力不足的隐形制约
5月15日消息,人工智能大模型的竞争格局正发生深刻变化。随着技术重心从模型训练转向实际推理,从云端部署下沉至千行百业,单纯依赖算力堆叠已难以构建持久的竞争优势。
在中国电子工业标准化技术协会数据存储专业委员会近期举办的“凝共识、探未来,走进先进存力”研讨活动中,一个核心观点成为共识:存储性能,正成为制约AI向更深层次、更广范围应用拓展的关键瓶颈,其战略价值亟待被充分认识和挖掘。
算力突飞猛进,存力成为短板
赛迪顾问电子信息产业研究中心副总经理袁钰分析指出,AI应用正从早期的个人娱乐场景,快速渗透到金融、制造、医疗等生产与生活的核心领域,任务复杂度和实时性要求呈指数级增长。大模型推理、AI智能体等应用的普及,使得数据存取的速度与系统响应延迟直接决定了用户体验。“当用户输入一段指令,如果模型回应迟缓或答案不精准,其背后往往可以追溯到数据存储与调取的效率问题。”

中电标协副理事长兼秘书长丁然的观点更为直接:“当前,AI发展的主要矛盾已从算力瓶颈转向存力瓶颈。”她进一步解释,面对万亿级参数模型、百万级token的超长上下文处理需求,存储系统的带宽和延迟面临着前所未有的挑战。而GPU及HBM(高带宽内存)的容量与带宽终究有限,这常常导致昂贵的GPU算力资源处于“等待数据供给”的闲置状态。整个AI系统的性能瓶颈,已从“计算是否足够快”演变为“数据能否被足够快地搬运到计算单元”。
中电标协数据存储专委会秘书长孙钢深入阐释了这一转变。他认为,在AI时代,存储与计算的关系正在发生根本性重塑。“传统架构中,存储更像一个被CPU调用的‘数据仓库’;而在AI计算场景中,GPU需要直接、高速地向存储索取海量数据。如果数据访问路径仍需经过CPU中转,大部分宝贵的时间就将消耗在漫长的等待上。”
他做了一个生动的比喻:“算力好比冲锋在前的先锋部队,但现在制约其战斗力的关键却在于后勤补给——也就是存储。一旦存储性能跟不上,再强大的算力也难免陷入空转。”尤其在模型推理场景下,KV Cache(键值缓存)、长文本支持、热温冷数据分层存储等新需求,都在倒逼存储的角色从“辅助运算”转向“存算协同”甚至“存算一体”。他预测,未来的智能存储系统或许还需要具备对数据内容的初步“理解”与预处理能力,而不再只是被动地存放比特。
作为行业实践者,中科曙光北京公司总裁助理、分布式存储产品部总经理石静分享了来自一线的观察。她指出,存储正从被动的“业务承载者”转变为主动的“系统效率决定者”。“我们在众多客户案例中发现,存储常常成为整个AI系统的性能短板——算力配置很高、网络速度很快,但存储却拖了后腿。为此,业界进行了大量技术创新,例如利用本地NVMe SSD构建全局共享缓存池、采用GDS(GPU Direct Storage)技术让GPU直接绕过CPU访问存储。在实际应用中,这些优化使得某自动驾驶万卡集群的GPU有效利用率提升了30%以上,而在AI for Science(科学计算AI)场景中,模型训练时间则缩短了20%到30%。”
不过,石静也坦言,目前的许多改进仍带有“被动应对”的色彩——正是因为存储成为了瓶颈,所以不得不进行优化。她更期待下一阶段的“主动引领”式变革:“我们能否真正围绕数据本身的价值流,去重构整个技术栈和生态?例如,以KV Cache的高效管理为中心来设计下一代推理框架,甚至以数据资产为中心,重新审视其在全生命周期内的确权、流动与安全。当前行业仍习惯围绕计算来规划工作,希望未来存储能真正跳出被动适配的角色,成为驱动业务模式创新的核心牵引力。”
应对瓶颈:标准统一与产业协同刻不容缓
面对存力成为AI发展新瓶颈的现实,建立统一的行业技术标准与协同机制显得尤为迫切。丁然透露,中电标协正从三个维度着力推动:一是标准先行,牵头制定AI场景下存算一体接口、能效评估、系统兼容性等方面的关键标准;二是架构创新,积极推动CXL(Compute Express Link)、GPU直连存储等新技术的标准化与产业化落地;三是生态构建,汇聚产业链上下游力量,形成存力与算力协同发展的健康产业格局。
孙钢补充强调,当前各厂商的解决方案路径尚不统一,相关知识也呈碎片化分布。他呼吁产业界应尽快建立面向AI的存储价值综合评估体系,不能仅关注容量、可靠性等传统指标,还需重点评估其在推理加速、向量数据库构建、训练效率提升等方面的实际业务效能。据他透露,旨在定义新一代AI存储能力要求的相关框架标准,预计将在今年年中正式发布。
石静则从企业实践角度指出,AI为存储行业按下了发展的加速键,但这个战略窗口期非常短暂。“AI算力的演进速度日新月异,存储厂商必须快速从最终用户侧捕获真实、迫切的需求,放弃过去追求‘大而全’通用产品的传统思路,转而深入聚焦于自动驾驶、大模型训练、科学计算等细分场景,实现产品的快速迭代与精准优化。”她表示,中科曙光已在下一代分布式存储架构、存算协同优化、绿色低碳存储等多个技术方向加速布局,以全面应对这场由AI浪潮催生的深度存储变革。
当算力的竞争步入深水区,“存力”这个曾经默默支撑的后台基石,正稳步走向舞台中央。能否成功突破存储性能瓶颈,不仅关乎未来AI基础设施的竞争格局,更在根本上决定了我国人工智能产业的应用深度与发展速度。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
特斯拉得州工厂量产Cybertruck入门版并组建Cybercab车队
清晨的得克萨斯州,无人机镜头缓缓掠过特斯拉超级工厂的广阔厂区。飞手乔特·格特迈尔捕捉到的航拍画面,传递出一个明确的产业信号:定价为59,990美元的双电机全轮驱动版Cybertruck,现已全面进入量产爬坡阶段。一批刚刚下线的新车整齐排列,场面恢弘,预示着这款备受瞩目的电动皮卡正加速驶向消费者。 这
苹果收购一人公司Patchflyer 今年一月完成交易
一则来自欧盟的最新收购备案,揭示了科技巨头苹果在年初完成的一次低调战略布局:其收购了一家名为Patchflyer的一人公司。这家公司的所有者,正是乔纳森·奥赫曼——在摄影与影视后期领域广受认可的网页端专业调色工具Color io的创始人。 此次交易不仅是资产收购,更是一次关键人才引进。苹果将奥赫曼本
AI算力瓶颈凸显:如何突破存力不足的隐形制约
人工智能发展重心转向推理,存储能力成为新瓶颈。大模型应用对数据存取速度要求苛刻,存储效率不足易导致算力空转。业界正通过技术优化提升存储性能,并推动制定标准以促进存算协同。存储从被动承载转向主动驱动,其突破将深刻影响AI产业发展。
微软确认部分Win11设备安装5月更新失败 卡在35%至36%进度
部分Windows11设备安装5月累积更新时,进度会卡在35%至36%,并显示错误代码0x800f0922。微软确认该问题与EFI系统分区剩余空间不足10MB有关。临时解决方案包括:普通用户可通过修改注册表键值“EspPaddingPercent”为0;企业用户则可应用组策略中的“已知问题回滚”策略来暂时规避。
NASA与Microchip合作研发抗辐射航天芯片技术
航天计算技术正迎来一次里程碑式的升级。美国国家航空航天局(NASA)近日联合美国微芯科技公司(Microchip),正式启动了名为“高性能航天计算”的研发项目。该项目的核心目标,是研制一款片上系统(SoC),其运算性能预计将达到当前航天专用处理器的百倍以上。 根据NASA的规划,这款高性能航天芯片将
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

