KV Cache需求暴增32倍,AI重塑存储产业链分工
在去年的CFMS|MemoryS峰会上,存储行业的主要议题仍然集中在传统痛点:价格何时能够稳定,QLC何时实现规模化量产,以及AI PC的实际落地时间表。当时,“AI将推动存储成为更基础、更关键的基础设施”这一观点,更像是一个行业预判,而非即时现实。
时隔一年,站在MemoryS 2026的会场里,业界讨论的话题已发生根本性转变。
如今人们关注的焦点不再是单纯的位元成本、颗粒供给与容量节奏,而是GPU利用率、token成本、系统调度效率,甚至物理AI场景中的实时决策能力。这些原本属于AI基础设施与系统架构层面的议题,正日益频繁地出现在存储产业的核心讨论中。
在传统计算架构中,存储的职责一直非常纯粹:保存数据。数据被写入、留存,需要时调取,无需时便静待系统边缘。它长期作为BOM成本中的一项,属于容量规划范畴,很少直接参与算力效率的定义。
但大模型训练与推理时代的到来,彻底改写了这个角色定位。
KV Cache的访问延迟,直接影响token生成速率;Checkpoint的写入效率,决定着GPU在训练过程中的等待时间;SSD的IOPS密度,又进一步影响大模型推理场景下的并发能力以及系统整体吞吐量。
存储正式进入了计算的主路径——它不再是后方的仓库,而是前线的指挥中枢。它决定数据流动的速度,也决定GPU算力能否被充分兑现。而这一点,正反向重塑整个存储产业链的分工逻辑。
存储进入计算路径,旧分工开始失效
AI推理领域有一个被反复讨论的瓶颈:KV Cache。
大模型在处理长上下文时,需要把每一层、每一个token生成过程中的Key和Value结果临时保存下来,避免重复计算。上下文越长,并发越高,这部分缓存的体量就越惊人。
当高带宽显存无法继续承接,KV Cache只能向下一层存储介质下沉。NVMe SSD就这样正式进入了AI推理的实时数据路径。
如果说过去SSD的使命是“提升加载速度”,那么在AI时代,它开始直接约束甚至决定推理吞吐的上限。
慧荣科技总经理苟嘉章的说法更为直接:“新一代存储,正从数据存储进入计算存储。”
这句话几乎点破了整个行业变化的本质。一旦存储进入计算路径,它就不再只是静态保存数据,而是开始影响token生成效率:访问时延影响输出速度,IOPS密度决定并发能力,写入效率左右Checkpoint节奏——最终共同作用于单位token成本。
也正因如此,AI场景对存储提出的要求,已经明显超出了“标准颗粒 + 通用主控 + 标准模组产线”这套旧模式的能力边界。
可以确定的是,2026年全球市场也许没有任何一款主流AI存储产品能够实现供需平衡。
表面看,这是先进产能持续向高毛利AI产品倾斜,消费级市场被进一步挤压;但更深层的问题是,即便产能跟得上,旧有分工模式也难以高效承接AI场景对定制化和快速迭代的需求。
存储厂商集体越界
当存储真正进入计算路径,产业链上原本清晰的角色边界开始松动:主控厂介入系统定义,模组厂延伸至固件与方案优化——大家都在补全过去并不属于自己的能力版图。
以慧荣为例,传统主控的核心任务是管理闪存介质、优化读写效率,在稳定性、兼容性和寿命之间找平衡。但AI时代,这套能力模型已经不够用了。
如今,慧荣开始反复强调一项新能力:性能动态调节。
慧荣科技总经理苟嘉章在与同行交流时多次提到,主控需要“根据工作负载、功耗和需求量,在动态中快速调整”。这已经不是传统意义上的硬件参数调优,而是直接响应英伟达新架构中“上下文内存存储(Context Memory Storage)”对实时调度的需求。

换句话说,主控正从“闪存控制器”演变为AI存储系统里的调度层。它不再只是负责把数据写进去、读出来,而是开始参与数据在GPU、显存和SSD之间流动节奏的定义。
这种变化,也在推动主控厂进一步向下游延伸。
慧荣正在积极与长江存储联合推进车规级方案,目标是在第三季度末至第四季度实现规模上量,直接供货国内车厂。过去卖芯片的公司,如今越来越多地以“联合方案提供方”的身份出现。
这意味着主控厂的商业角色正在发生变化:一边向上理解AI工作负载,把主控纳入系统调度;一边向下输出完整方案,从卖芯片转向卖系统能力。
未来存储产业的竞争,不再只发生在颗粒、主控或模组层面,而是进一步延伸到封装架构、异构互连和系统级协同——是一场生态、技术、产能、客户、资本的综合战争。
端侧AI反向定义存储
AI对存储的重构,显然不只发生在数据中心。
另一条同样重要的战线正在端侧迅速展开——AI PC、机器人、游戏掌机、智能眼镜,乃至更多尚未被完全定义的新型终端,都在把存储推向更核心的位置。
正如众多厂商在峰会上提到的,物理AI/端侧AI将迎来更广泛的发展,并带来更智能化的体验。而这些更新更好的体验会带来更高的产品溢价,足以抵抗存储价格上涨的压力。
这句话背后,点出了端侧AI最现实的商业逻辑:只要体验提升足够明显,存储成本就不再只是成本,而是会转化为产品价值的一部分。
但与数据中心不同,端侧AI面临的不是单一性能问题,而是高度碎片化的场景挑战。
一台AI PC需要在本地运行大模型,对存储的核心诉求是大容量加高速读取;一台机器人需要在高震动、高移动性的复杂环境中持续稳定运行,同时还要支持后期扩容;一副智能眼镜则将需求进一步推向极致的小尺寸、低功耗和高集成度。
可插拔、可扩容、高抗震、小尺寸、高容量——这些要求往往彼此矛盾,很难通过同一款标准化模组同时满足。
这也是为什么,端侧AI正在比数据中心更早地倒逼存储方案走向场景化重构。
佰维给出的解法极具代表性。
针对机器人场景,他们推出了一套“BGA SSD + Mini SSD”的组合方案:BGA SSD直接焊接在主板上,以更强的抗震性承担系统盘角色,保障操作系统和本地AI模型稳定运行;Mini SSD则采用类SIM卡槽设计,支持用户无工具插拔,作为数据盘解决嵌入式设备后期无法扩容的长期痛点。
这套方案的关键,并不只是形态创新,而是背后的产品逻辑:把“稳定”和“灵活”拆分为两个独立部件,并分别做到最优。这本质上已经不是传统意义上的“卖一块SSD”,而是在重新定义机器人的存储架构。
更值得关注的是,佰维的动作并未停留在单一产品层面。
他们正在推动Mini SSD从企业级方案进一步走向行业标准。通过联合产业链上下游成立IP公司,并同步制定激励机制和权益金分配规则,佰维试图把“可插拔存储”推进为下一代AI终端的标准能力。
其目标场景并不局限于机器人,而是进一步覆盖AI PC、游戏掌机等多类设备——这些终端当前仍采用不同形态的本地存储方案,而Mini SSD的野心,是用统一接口去重新组织它们。
换句话说,它争夺的不只是产品份额,而是下一代端侧AI设备的标准定义权。
在这个过程中,过去那套面向PC和手机时代的标准化存储模组,已经越来越难承接碎片化、多形态、高迭代的终端需求。
更深层的变化在于,设备与存储之间的关系正在发生方向性的逆转——过去是设备定义存储,设备要做什么,存储就被动适配什么。
而现在,随着本地AI能力越来越依赖容量、带宽、功耗和形态协同,存储开始反过来影响设备形态、产品定义,乃至最终用户体验。
下一战:功耗、延迟、智能
AI最大的痛点并非算力不足,而是数据在存储与计算单元间的频繁搬运,这严重降低了系统效率。如何减少这种数据搬运,已成为行业共同攻关的核心命题。
这句话放在一年前,可能还有点抽象。但经过过去一年产业链上下游一连串几乎同步发生的变化之后,它开始落到一个个极其具体的技术指标上:KV Cache的访问时延、Checkpoint的写入效率、单位token成本……
过去十年,产业比拼的是单位容量的成本;下一个十年,胜负手将取决于数据在计算与存储之间流动的效率、功耗与智能。
至于那些仍固守在旧分工里、只盯着颗粒价格波动的玩家,留给他们的时间,或许真的不多了。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
小米集团辟谣官微上线,定位官方辟谣平台
小米辟谣官微6月30日正式上线,作为集团官方辟谣阵地,用户可查询辟谣声明、反馈谣言线索。账号将主动澄清网络谣言,维护合法商誉,并致力于打造权威辟谣通道,保障公众知情权与合法权益。
小米官方辟谣账号上线持续维护合法商誉
6月30日,小米集团的一则动态引发热议:小米辟谣官方账号,正式上线了。简单来说,小米这次将澄清谣言的工作直接推到了前台——在中央网信办违法和不良信息举报中心的指导下,小米辟谣的全新阵地宣告成立。 目前,这个辟谣账号已在微博开通。用户可以通过它核实与查阅小米官方的辟谣声明,也可以反馈任何涉及小米的谣言
特斯拉Cybercab无驾舱量产车在奥斯汀启动L4级公开道路测试
特斯拉Cybercab量产车在奥斯汀启动L4级公开测试,彻底取消方向盘等物理控制装置。安全监督员仅观察不干预。车辆专为Robotaxi设计,搭载HW4 0与FSDV14 3 3系统,续航672公里,支持无线充电,实现全程独立驾驶。
鸿蒙智行回应问界M5车内异味系第三方配件所致
6月30日,针对近期网络热议的“问界M5车内异味”事件,鸿蒙智行官方小助手在社区帖子下方发布了正式回应。官方表示,已对刘先生的这辆车进行了全面检测排查。工作人员上门核查后发现,涉事车辆内部加装了大量第三方配件,包括非原厂皮质、塑胶收纳摆件、脚托、抱枕、车衣等。在拆除所有加装配件后,工作人员严格依照国
闫闯直言20万买电车选400V太愚蠢
2026年6月30日,微博上一则关于电动汽车高压平台技术路线的争论迅速引爆热搜。坐拥超过475万粉丝的汽车领域博主闫闯,在归还体验了4天的理想i6时,专门花费6分多钟把电量充至满格,并掷地有声地留下一句:“一点不比加油慢。”随后他补充道:“还是那句话,都这时代了,20万+电车还买400V的绝对愚蠢。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:22
2026-07-02 11:21
2026-07-02 11:21
2026-07-02 11:21
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

