谷歌新内存技术冲击存储芯片市场 闪迪股价大跌超11%
3月27日消息,据媒体报道,美东时间3月26日,存储芯片股集体重挫,闪迪跌超11%,希捷跌逾8%,超威半导体、西部数据跌逾7%,美光科技跌近7%。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
业内人士分析,这一波动源自谷歌研究院即将在国际学习表征会议(ICLR 2026)上正式亮相的学术论文,该研究推出了一种新型AI内存压缩技术“TurboQuant”。
谷歌宣称,该技术可将大语言模型推理中的缓存内存占用压缩至六分之一,并在英伟达H100 GPU上实现最高8倍的性能加速。
AI模型运行时存在一种“工作内存”,即KV缓存(Key-Value Cache)。每当模型处理信息、生成回答时,KV缓存便会迅速膨胀,且上下文窗口越长,缓存占用的内存越大。
TurboQuant本质上是一种极致的量化压缩算法,传统量化方法需要在压缩精度和额外存储开销之间妥协,而谷歌团队通过PolarQuant(极坐标量化)和QJL(量化JL变换)两项创新,实现了在“零损失”前提下将KV缓存压缩至3-bit精度。
Cloudflare首席执行官将这一成果称为谷歌的“DeepSeek时刻”,认为其有望像DeepSeek一样,通过极致效率大幅拉低AI的运行成本。
不过,摩根士丹利在最新研报中指出,市场对此存在误读。该技术仅作用于推理阶段的键值缓存,并不影响模型权重所占用的高带宽内存(HBM),也与AI训练任务无关。
分析师强调,所谓的“6倍压缩”并非存储总需求的减少,而是通过效率提升增加单GPU的吞吐量。这意味着在相同硬件条件下,可以支持4倍至8倍更长的上下文,或在不触发内存溢出的前提下显著提升批处理规模。
目前,谷歌尚未公布TurboQuant在Gemini等自研模型中的具体部署时间表,研究团队计划在下个月的ICLR 2026会议上正式发布相关成果。

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
马斯克拟赠散户30% SpaceX新股,撼动华尔街与行业格局
3月27日消息,最新消息显示,马斯克正计划将 SpaceX 高达30% 的新股份额分配给个人投资者,依托自身庞大的铁杆粉丝群体,助力公司上市后稳住股价。纵观美股 IPO 常规操作,企业一般仅会拿出
63岁俞敏洪亲自试用带货面膜,网友调侃:真拼了
3月27日消息,近日,一段关于新东方创始人俞敏洪的直播片段在社交平台上引发热议。这位已经63岁、身家高达121亿企业家,竟然在直播间里亲自上阵带货面膜,视频画面显得既真实又带有一丝喜感。俞敏洪和两个
芯穹夏立雪解构中国Token经济:构建智能Token工厂,重塑数字生态
“Token每两周翻一倍”,AI infra 正在被重写”。“这种增长速度,在人类历史上都很少见。”这是无问芯穹CEO夏立雪对当下AI行业最直观的感受。“养虾”成潮流后,AI产业进入到一个更有意思的
骑手质疑700元大单到手仅3元,美团回应订单不属实
3月27日消息,近期,有美团骑手发视频称自己接了个700多元大单,到手只有3块钱,顾客给了50多块全被平台扣了。该消息引发网友热议,美团最新今天正式发布辟谣称:假的。为核实真相,美团对该博主提及的各
佛山大巴现中亚街头?当地交管回应车辆被转卖
3月27日消息,据媒体报道,有网友近日在社交平台发视频称,他在乌兹别克斯坦偶遇一辆写着“三水城巴”的客车,甚感惊喜。视频显示,该大巴的尾部还喷写有“三水城巴”和粤E车牌,但实际悬挂的是乌兹别克斯坦当
- 日榜
- 周榜
- 月榜
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

