数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

科技数码

谷歌压缩算法解读：内存通胀时代的终结者？

谷歌压缩算法解读：内存通胀时代的终结者？

热心网友时间：2026-03-26

转载

破解算力问题，降低模型所需的存算空间，有很多种途径，是减少训练时算力，还是减少推理时算力？稀疏化、量化、压缩、蒸馏等手段，都是方法之一。只是当前鉴于不同方法的优势特征，各家模型企业及研究机构都会选择

破解算力问题，降低模型所需的存算空间，有很多种途径，是减少训练时算力，还是减少推理时算力？稀疏化、量化、压缩、蒸馏等手段，都是方法之一。只是当前鉴于不同方法的优势特征，各家模型企业及研究机构都会选择不同的策略。

以长上下文任务为例，过去两年，AI算法团队曾提出要以键值缓存（KV Cache）为中心的分离架构设计，即根据不同计算特性将预填充服务器与解码服务器分开，在大batch size及队列场景下需要更大的系统内存带宽。简而言之，对于许多推理时任务来说，瓶颈在于内存带宽。

今日，谷歌发布了一项名为TurboQuant的算法，这项技术旨在解决上述提及的问题：大模型运行时的内存消耗。其核心是让AI在思考和回答问题时，占用少得多的工作内存，同时保持几乎相同的智力水平，甚至速度更快。

根据最新描述，TurboQuant的推出预计会带来多项利好：模型推理方面，百万Token上下文成本会明显下降；向量数据库领域，更容易做到实时索引和亚毫秒查询；边缘AI领域，手机和嵌入式设备的上下文推理更现实。此外，该思路同样可扩展到多模态领域的向量压缩。

事实上，就在该技术发布当日，美股存储板块如美光科技、闪迪等应声下跌。近年来，内存(RAM)、固态硬盘(SSD)、硬盘驱动器(HDD)等存储产品受下游数据中心建设扩张需求的激增，出现了一段时间的供应短缺及价格推高。该市场反应可以理解为，TurboQuant一旦广泛应用，或将显著影响未来对AI推理服务器中内存容量规格的需求判断，重塑相关硬件的成本曲线。

要理解TurboQuant的价值，首先要明白大模型在生成文本时是如何工作的。它们并非一次性处理所有信息，而是像人类阅读一样，一个字一个字地生成。在这个过程中，模型需要一个“临时记事本”来记住之前所有对话的内容，以免重复计算。这个“记事本”在技术上被称为键值缓存（KV Cache）。但问题在于，对话越长，这个“记事本”就越厚，占用的内存就越多。以长文本为例，在处理超长文档或复杂多轮对话时，KV Cache会迅速撑满昂贵的高性能内存，成为制约AI处理速度、推高运行成本的主要瓶颈。

TurboQuant运用了两个结算的核心算法：PolarQuant主压缩和QJL（量化Johnson-Lindenstrauss变换）残差校正，目标是压缩KV Cache中的向量。

第一步：PolarQuant——高质量压缩

传统量化方法类似于用直角坐标系（东、北方向）记录一个点的位置。TurboQuant的第一步，是PolarQuant，改用极坐标（角度和距离）来描述。研究发现，经过特定的数学变换（随机旋转）后，高维向量的数值分布会变得非常规律和集中，就像一个固定的圆形网格。这样一来，系统可以预先计算好一套最优的压缩码本，无需针对每次对话进行复杂的校准，实现了在线实时压缩。这一步用大部分比特对数据主体进行了高质量压缩。

第二步：QJL——消除隐藏误差

第一步压缩后，会残留微小的误差。如果放任不管，在AI计算注意力（即决定关注对话中哪部分内容）时，这些误差会累积并导致结果出现偏差。TurboQuant的第二步创新在于，它用一个名为QJL的方法来处理这些残差。QJL的特点在于，它仅用1个比特（即一个正负号）来表征残差，并与高精度的原始查询向量结合，最终能实现无偏的内积估计。这意味着，尽管数据被大幅压缩，但AI在计算“哪些信息更重要”时，得到的结果依然是准确无误的。

什么是QJL？简单说，就是一种把高维向量“投影”到低维空间的方法，且能以数学证明保证距离关系不被破坏太多。QJL把这个投影结果进一步压缩到1比特，体积极小，但仍能作为无偏估计器。

根据谷歌最新博客阐述，TurboQuant带来了接近理论极限的性能提升：

极致压缩：可以将KV Cache压缩到每通道仅3比特，相比传统的16或32比特存储，减少了至少6倍的内存占用。在长上下文测试中，即使压缩后，模型依然能找到隐藏的信息，表现满分。精度无损：在多个标准长上下文基准测试（如LongBench、Needle in a Haystack）上，使用3.5比特配置的TurboQuant，模型性能与使用全精度缓存时完全一致，2.5比特配置下也只有轻微的性能下降。速度提升：由于需要从内存中读取的数据量锐减，计算速度得到极大提升。在H100 GPU上，4比特TurboQuant的注意力核心步骤的速度，比未压缩的32比特版本快8倍。

TurboQuant能够以极低的内存占用、近乎零预处理时间和最先进的精度构建和查询大型向量索引。这使得谷歌规模的语义搜索速度更快、效率更高。当然，TurboQuant的意义远不止于一项实验室突破。据博客所述，向量量化虽然目前主要解决的是Gemini等模型中的KV-cash瓶颈，但该技术同样适用于需要在高维向量数据库中进行海量搜索的场景（如现代语义搜索引擎）。

相关论文将在ICLR 2026和AISTATS 2026发表。

相关链接：https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

相关论文链接：https://arxiv.org/pdf/2502.02617

（本文作者 | 杨丽，编辑 | 杨林）

来源:https://www.163.com/dy/article/KOV1UA4K05118O92.html

上一篇：中电联杨昆谈“人工智能+”如何重塑电力产业链

下一篇：快手电商可靠吗？电厂实战测评告诉你真相

游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

同类文章

小米SU7六月销量揭晓零售34738辆批发超2万辆

小米SU7六月销量揭晓零售34738辆批发超2万辆

7月1日，小米汽车官方微博发布消息称：2026年6月，月交付量稳定突破30000台。信息虽简短，但详细数据仍需参考乘联会的统计报告。小米官方未单独公布具体数字，不过乘联会在6月全国乘用车市场分析中清晰列明：小米汽车新能源乘用车零售销量达34738辆，其中主力车型SU7批发销量突破2万辆，具体为20

时间：2026-07-09 13:02

Meta投资百亿美元建设加拿大首个数据中心

Meta投资百亿美元建设加拿大首个数据中心

Meta在加拿大阿尔伯塔省投资约100亿美元建设首个海外数据中心，装机容量1吉瓦，预计两三年内建成。同时探索云计算业务，向第三方出售算力。市场对其资本支出逻辑和回报存在质疑。

时间：2026-07-09 13:02

iPhone 18 Pro A20 Pro芯片沿用LPDDR5X架构

iPhone 18 Pro A20 Pro芯片沿用LPDDR5X架构

苹果A20Pro芯片未用LPDDR6，沿用LPDDR5X，通道从4条增至6条，位宽达96-bit，优化AI推理、多任务及影像性能，成本与体验间优先释放当下性能。

时间：2026-07-09 13:02

三星全业务启动AI转型全面引入生成式AI工具

三星全业务启动AI转型全面引入生成式AI工具

三星宣布全面启动人工智能转型，将在所有关联公司部署双子星、ChatGPT等生成式人工智能工具，覆盖设计、研发、生产、营销、服务等八大核心业务环节，同时设立专职人工智能组织，对高管和员工开展系统培训，并发布人工智能转型共同愿景宣言。

时间：2026-07-09 13:01

太平洋证券：硅烷材料从光伏辅料拓展至硅碳负极与光纤核心

太平洋证券：硅烷材料从光伏辅料拓展至硅碳负极与光纤核心

电子特气是半导体制造第二大耗材，市场规模预计从2024年195亿元增至2030年708亿元。硅烷材料凭借“气体+含硅”双重特性，从光伏辅料向硅碳负极、光纤核心原料跃迁，成为重要增长极。

时间：2026-07-09 13:01

热门专题

刀塔传奇破解版无限钻石下载大全

刀塔传奇破解版无限钻石下载大全

洛克王国正式正版手游下载安装大全

洛克王国正式正版手游下载安装大全

思美人手游下载专区

思美人手游下载专区

好玩的阿拉德之怒游戏下载合集

好玩的阿拉德之怒游戏下载合集

不思议迷宫手游下载合集

不思议迷宫手游下载合集

百宝袋汉化组游戏最新合集

百宝袋汉化组游戏最新合集

jsk游戏合集30款游戏大全

jsk游戏合集30款游戏大全

宾果消消消原版下载大全

宾果消消消原版下载大全

热门数据榜

VSona推出AI伴侣开发新方案

AI音频母带处理工具Mastermallow

MyCharacter.ai：创建收藏互动AI角色的dApp

ToMate AI自动回复客户消息

角色设计AI工具实现姿势表情风格的一致性

UpWin优化亚马逊销售节省时间获得竞争优势

CustomWritings AI写作工具克服写作困难提升学术水平

Faraday.dev 后院AI 离线与AI角色聊天

JimakuAI智能英日字幕翻译工具

PowerIn自动驾驶模式让领英评论自动生成由ChatGPT驱动

VSona推出AI伴侣开发新方案

AI音频母带处理工具Mastermallow

MyCharacter.ai：创建收藏互动AI角色的dApp

ToMate AI自动回复客户消息

角色设计AI工具实现姿势表情风格的一致性

UpWin优化亚马逊销售节省时间获得竞争优势

CustomWritings AI写作工具克服写作困难提升学术水平

Faraday.dev 后院AI 离线与AI角色聊天

JimakuAI智能英日字幕翻译工具

PowerIn自动驾驶模式让领英评论自动生成由ChatGPT驱动

VSona推出AI伴侣开发新方案

AI音频母带处理工具Mastermallow

MyCharacter.ai：创建收藏互动AI角色的dApp

ToMate AI自动回复客户消息

角色设计AI工具实现姿势表情风格的一致性

UpWin优化亚马逊销售节省时间获得竞争优势

CustomWritings AI写作工具克服写作困难提升学术水平

Faraday.dev 后院AI 离线与AI角色聊天

JimakuAI智能英日字幕翻译工具

PowerIn自动驾驶模式让领英评论自动生成由ChatGPT驱动

相关攻略

相关攻略

小米SU7六月销量揭晓零售34738辆批发超2万辆

2026-07-09 13:02

小米SU7六月销量揭晓零售34738辆批发超2万辆

Meta投资百亿美元建设加拿大首个数据中心

2026-07-09 13:02

Meta投资百亿美元建设加拿大首个数据中心

iPhone 18 Pro A20 Pro芯片沿用LPDDR5X架构

2026-07-09 13:02

iPhone 18 Pro A20 Pro芯片沿用LPDDR5X架构

三星全业务启动AI转型全面引入生成式AI工具

2026-07-09 13:01

三星全业务启动AI转型全面引入生成式AI工具

太平洋证券：硅烷材料从光伏辅料拓展至硅碳负极与光纤核心

2026-07-09 13:01

太平洋证券：硅烷材料从光伏辅料拓展至硅碳负极与光纤核心

年Q1全球零售Wi-Fi CPE出货量同比下滑6% ISP硬件升级

2026-07-09 13:01

年Q1全球零售Wi-Fi CPE出货量同比下滑6% ISP硬件升级

OpenAI最强语音模型GPT-Live发布，AI对话更接近真人

2026-07-09 13:01

OpenAI最强语音模型GPT-Live发布，AI对话更接近真人

HY3正式版体验：开发AI焦虑游戏缓解腾讯焦虑

2026-07-09 13:01

HY3正式版体验：开发AI焦虑游戏缓解腾讯焦虑

热门教程

游戏攻略
安卓教程
苹果教程
电脑教程

神仙代售官方网站登录入口地址2025最新版获取方法

神仙代售官方网站登录入口地址2025最新版获取方法发布于 2026-07-09

红色沙漠不屈英雄套装获取方法及任务攻略

红色沙漠不屈英雄套装获取方法及任务攻略发布于 2026-07-09

神仙代售官方网站正版授权平台

神仙代售官方网站正版授权平台发布于 2026-07-09

天天拼词王第190关族月光月光族20个常用字图文攻略

天天拼词王第190关族月光月光族20个常用字图文攻略发布于 2026-07-09

年模拟经营百货大楼游戏排行下载合集

年模拟经营百货大楼游戏排行下载合集发布于 2026-07-09

毁灭战士黑暗时代启示录版先行深度评测

毁灭战士黑暗时代启示录版先行深度评测发布于 2026-07-09

模拟山羊3手机版官方上线时间正式揭晓

模拟山羊3手机版官方上线时间正式揭晓发布于 2026-07-09

月光茧上线时间揭晓具体日期与详情

月光茧上线时间揭晓具体日期与详情发布于 2026-07-09

Win11无法启动应用程序？尝试重新安装修复

Win11无法启动应用程序？尝试重新安装修复发布于 2026-07-09

电脑提示由于找不到vcruntime140_1.dll报错的详细解决方法

电脑提示由于找不到vcruntime140_1.dll报错的详细解决方法发布于 2026-07-09

银河麒麟下C语言编译器的安装与配置方法

银河麒麟下C语言编译器的安装与配置方法发布于 2026-07-09

银河麒麟系统WPS无法插入公式的解决教程

银河麒麟系统WPS无法插入公式的解决教程发布于 2026-07-09

AMD显卡锁定帧数是否影响画质

AMD显卡锁定帧数是否影响画质发布于 2026-07-09

外星人笔记本触控板关闭后仍可用正常吗

外星人笔记本触控板关闭后仍可用正常吗发布于 2026-07-09

TP-Link路由器登录地址支持HTTPS吗

TP-Link路由器登录地址支持HTTPS吗发布于 2026-07-09

外星人笔记本触摸板关闭后指针仍动解决方法

外星人笔记本触摸板关闭后指针仍动解决方法发布于 2026-07-09

热门话题

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

可灵AI使用教程_可灵视频生成指南_AI短片创作技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

海螺AI使用教程_MiniMax视频音乐生成指南_海螺AI实战技巧

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

讯飞星火使用教程_星火大模型功能解析_办公写作学习指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

文小言使用教程_百度AI助手功能解析_文心智能体使用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

智谱清言使用教程_GLM大模型能力解析_清言AI实用指南

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

天工AI使用教程_天工搜索写作指南_昆仑万维AI助手解析

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

腾讯元宝使用教程_腾讯元宝AI功能解析_搜索写作智能体指南

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

即梦AI使用教程_即梦图片视频生成指南_提示词与创作技巧

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战

Microsoft Copilot使用教程_Copilot办公与编程指南_微软AI助手实战