mysql如何通过索引跳跃扫描提升查询_MySQL8.0对InnoDB的优化

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

数据库

mysql如何通过索引跳跃扫描提升查询_MySQL8.0对InnoDB的优化

热心网友时间：2026-04-23

转载

MySQL 8.0 的 INDEX SKIP SCAN：真能跳过前导列吗？

mysql如何通过索引跳跃扫描提升查询_MySQL8.0对InnoDB的优化

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

先说一个核心判断：MySQL 8.0引入的INDEX SKIP SCAN确实能跳过联合索引的前导列进行查询，但这绝非随心所欲的“跳跃”。它更像是在一系列严格约束下，优化器施展的一套“组合拳”。

MySQL 8.0 的 `INDEX SKIP SCAN` 是什么，它真能跳过前导列？

答案是肯定的，但前提相当苛刻。简单来说，只有当联合索引的第一列（也就是前导列）拥有**极高的基数，重复值很少**，同时你的查询条件又**恰好跳过了这一列，只使用了后面的列**时，优化器才可能启动INDEX SKIP SCAN。它并非魔法般地直接忽略前导列，而是把前导列每一个不同的非NULL值都当作一个独立的查询起点，然后分别执行一次快速的索引范围扫描——你可以把它理解为多次精准“点射”拼接起来的一次“扫射”。

一个典型的触发场景是这样的：假设有一张用户表，我们为(first_name, last_name)建立了联合索引。当查询WHERE last_name = 'Smith'时，前导列first_name并未出现在条件中。按照传统B+树索引的“最左前缀匹配”原则，这个索引似乎就失效了。但在MySQL 8.0+的环境下，优化器可能会祭出SKIP SCAN来挽救局面。

当然，想看到这一幕，还得满足几个硬性条件：

表引擎必须是InnoDB（MyISAM不支持此特性）。
联合索引至少需要两列，并且前导列不能是NULL的天下（如果全是NULL或者大量重复值，优化器会直接放弃）。
查询条件里绝对不能包含对前导列的范围或模糊查询（比如first_name > 'A'或first_name LIKE 'J%'），否则会直接退化为全索引扫描。
如何验证？通过EXPLAIN FORMAT=TRADITIONAL查看执行计划，如果Extra字段出现了Using index skip scan，那就恭喜你了。

为什么加了索引却没走 `INDEX SKIP SCAN`？

这恐怕是最让人困惑的地方。明明结构符合，为什么执行计划就是不选它？最常见的原因在于优化器的“成本核算”。优化器经过一番估算，可能觉得走SKIP SCAN反而更亏。比如，前导列的基数太低（像gender字段只有‘M’和‘F’两种值），这意味着SKIP SCAN需要发起两次完整的索引子查询，其总成本可能已经超过了直接扫描主键再回表的代价。此外，表的统计信息过时，导致优化器误判数据分布，也是常见元凶。

遇到这种情况，可以尝试从以下几个方向排查：

首先，使用ANALYZE TABLE table_name命令更新一下表的统计信息，特别是在大数据量写入或删除之后。
接着，定量评估前导列的区分度。执行SELECT COUNT(DISTINCT first_name) / COUNT(*) FROM users;，如果这个比值非常低（例如低于0.01），那么SKIP SCAN被忽略的概率就极大。
需要警惕的是，常用的索引提示如USE INDEX和FORCE INDEX对SKIP SCAN是无效的。你只能通过设置optimizer_switch='skip_scan=on'来全局开启（默认是开启的），或者考虑改写查询语句本身。
最后，检查是否有隐式的类型转换在捣鬼。比如last_name字段是VARCHAR类型，但查询条件却传入了数字，这会导致索引失效，SKIP SCAN自然也无从谈起。

`INDEX SKIP SCAN` 和覆盖索引、松散索引扫描的区别

这三者都是提升查询性能的利器，但工作机制截然不同，千万别混淆：

覆盖索引：追求的是“一站式”服务，要求SELECT和WHERE中涉及的所有列都包含在同一个索引中，从而彻底避免回表操作。而SKIP SCAN不关心这个，它只解决“如何在不使用前导列的情况下定位数据”这个难题，查询可能仍然需要回表获取其他字段。
松散索引扫描：这通常是GROUP BY操作的“专属福利”，它利用索引的有序性，跳过重复的键值组来加速聚合计算。它不适用于普通的WHERE条件查询。而SKIP SCAN则是专门为WHERE条件设计的、针对每个不同前导列值进行扫描的机制。
从性能角度理解，SKIP SCAN的I/O开销大致等于“前导列唯一值的个数”乘以“单次索引深度查找的成本”。如果前导列有1000个不同值，那就相当于进行了1000次小范围的索引查找。这肯定比全表扫描快得多，但比起那种能直接利用前导列进行的一次精准等值查找，效率上还是有明显差距的。

实操建议：什么时候该主动建“适合 SKIP SCAN”的索引？

一句话总结：不要本末倒置，为了迎合SKIP SCAN而去设计索引。索引设计的黄金法则依然是，优先确保高频查询的条件列能够作为索引的前导列。

那么，什么情况下才需要考虑SKIP SCAN的适用性呢？当你明确存在一类查询模式，它总是基于非前导列进行过滤，而这列的选择性（基数）又很高，同时你无法轻易调整查询语句或现有索引结构时，或许可以考虑将那个高基数列调整到索引的更靠前位置。

举个例子：一张日志表上有一个联合索引(tenant_id, status, created_at)。大部分查询只想按status过滤，但status是第二列。如果tenant_id的基数极高（比如有上百万个租户），而多数查询又不带tenant_id条件，那么这个索引对status查询几乎就是摆设。此时，更优的方案可能是为status单独建立索引，或者将索引顺序调整为(status, tenant_id)。
与其凭空猜测，不如借助数据说话。利用sys.schema_index_statistics系统视图，可以直观地观察到每个索引的实际使用频率和平均扫描行数，这比任何理论推测都更可靠。
必须清醒认识到，SKIP SCAN是优化器在索引设计不完美时的一种“兜底”能力，而不是索引设计的追求目标。真正稳定、高效的性能，永远来自于查询条件与索引结构的精准对齐。

最后提一个容易忽略的细节：即使执行计划显示使用了SKIP SCAN，你也无法直接从计划中看出它“跳过”了多少个不同的前导列值。rows字段显示的是所有子扫描的总行数，这个数字可能会远大于你直觉预期的一次查找所扫描的行数。因此，分析执行计划时，一定要结合rows和filtered字段综合判断其真实代价。

来源:https://www.php.cn/faq/2311790.html

上一篇： MySQL存储过程如何动态构建SQL语句_PREPARE语句使用教程

下一篇：为什么SQL连接查询速度突然变慢_查看执行计划定位Index_Scan失效