Mysql因为字段字符集编码的问题导致索引没生效的解决方案
深入解析SQL查询性能问题:字符集不一致导致的索引失效
SELECT s.department_name AS departmentName,
cps.purchase_type AS purchaseType
FROM settlement_records s
LEFT JOIN common_products_specification cps
ON cps.org_id = s.purchase_org_id AND cps.specification_system_sn = s.specification_system_sn AND
cps.delete_flag = 0
WHERE s.delete_flag = 0
AND s.purchase_org_id = 1540
AND s.purchase_org_type = 1;
两张表在关联字段上都建立了索引,这是数据库性能优化的良好实践,为查询效率奠定了基础。
create index idx_settlement_join on settlement_records (purchase_org_id, purchase_org_type, delete_flag, product_id, vendor_id); create index idx_settlement_org_del on settlement_records (purchase_org_id, purchase_org_type, delete_flag);
create index idx_cps_org_spec_del on common_products_specification (org_id, specification_system_sn, delete_flag);
EXPLAIN执行计划深度分析
[
{
"id": 1,
"select_type": "SIMPLE",
"table": "s",
"partitions": null,
"type": "ref",
"possible_keys": "idx_settlement_org_del,idx_settlement_join",
"key": "idx_settlement_org_del",
"key_len": "13",
"ref": "const,const,const",
"rows": 31780,
"filtered": 100,
"Extra": null
},
{
"id": 1,
"select_type": "SIMPLE",
"table": "cps",
"partitions": null,
"type": "ref",
"possible_keys": "idx_cps_org_spec_del",
"key": "idx_cps_org_spec_del",
"key_len": "8",
"ref": "const",
"rows": 6469,
"filtered": 100,
"Extra": "Using where"
}
]
从EXPLAIN执行计划分析,查询虽然使用了为连接条件创建的idx_cps_org_spec_del索引,但并未充分发挥其效能。
关键线索在于key_len=8这个数值。 这个长度表明,这个包含三列的复合索引,在实际查询中仅使用了第一列org_id。该列的数据类型为bigint,在MySQL中恰好占用8字节。
Extra列出现的“Using where”进一步证实了这一点。这意味着MySQL只能先利用索引定位满足org_id条件的所有数据行,然后返回服务器层,逐行比对specification_system_sn和delete_flag这两个条件。
性能瓶颈由此产生: 驱动表settlement_records返回的31780行结果,每一行都需要在被驱动表中匹配约6469行数据,总计进行超过两亿次的逐行比较。这种大规模的回表操作,是导致SQL查询缓慢的根本原因。
复合索引为何无法完全匹配?
这引出了核心疑问:索引结构设计看似合理,为何在表连接时无法完全生效?
答案通常隐藏在细节之中。通过执行以下查询,我们发现了问题的根源——连接双方在specification_system_sn字段的字符集编码上存在差异:
SHOW FULL COLUMNS FROM settlement_records LIKE 'specification_system_sn'; -- 结果:utf8mb4_0900_ai_ci SHOW FULL COLUMNS FROM common_products_specification LIKE 'specification_system_sn'; -- 结果:utf8mb3_general_ci
问题真相大白。MySQL字符集和排序规则不一致,是导致索引失效的罪魁祸首。 MySQL在执行JOIN操作时,发现两列虽然字段名相同,但底层编码规则不同,无法直接进行高效的索引匹配。因此,数据库优化器只能退而求其次,仅使用索引的第一列进行过滤,将更精确的匹配工作留给代价更高的内存过滤。
解决方案直接明了: 统一字符集编码。
ALTER TABLE common_products_specification MODIFY specification_system_sn VARCHAR(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;
完成字符集统一后,查询性能立即得到显著提升,从“长时间等待”转变为“秒级响应”,优化效果立竿见影。
字符集不一致的成因分析
这背后,往往是MySQL版本演进和数据库迁移历史留下的“技术债务”。
简要回顾MySQL字符集的发展历程:
- utf8mb3:这是MySQL历史上“标准的UTF-8”实现,每个字符最多使用3个字节表示。在MySQL 5.5版本之前是默认选择,许多遗留系统的表结构都基于此字符集创建。
- utf8mb4:从MySQL 5.5版本开始被广泛推荐,使用4个字节完整支持所有Unicode字符(包括Emoji表情、特殊符号等),逐渐成为新项目的默认字符集标准。
- utf8mb4_0900_ai_ci:MySQL 8.0时代的官方默认排序规则,基于Unicode 9.0标准,相比旧的排序规则更加精确和标准化。
因此,字段字符集不一致通常源于两个原因:一是建表时人为指定了不同的编码规则;二是更常见的情况——数据库从旧的MySQL 5.x版本迁移到8.0时,为保持兼容性,MySQL默认保留了原有的字符集设置,未进行全局统一转换。
如何将整个数据库统一为utf8mb4_0900_ai_ci字符集
既然找到了问题根源,对于运行在MySQL 8.0环境中的数据库,完全可以考虑将整个数据库的字符集统一为utf8mb4_0900_ai_ci,从根本上避免类似问题。以下是标准的操作流程。
- 第一步:检查并修改数据库默认字符集
-- 查询数据库当前字符集设置
SELECT
schema_name AS database_name,
default_character_set_name AS character_set,
default_collation_name AS collation
FROM information_schema.schemata
WHERE schema_name = 'datebase_name';
-- 若字符集不符合目标,则执行修改
ALTER DATABASE your_database_name
CHARACTER SET = utf8mb4
COLLATE = utf8mb4_0900_ai_ci;
- 第二步:批量生成并执行表字符集修改语句
-- 生成修改表字符集的SQL语句
SELECT CONCAT(
'ALTER TABLE `', table_name, '` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;') AS alter_sql
FROM information_schema.tables
WHERE table_schema = 'datebase_name'
AND table_type = 'BASE TABLE'
AND (table_collation != 'utf8mb4_0900_ai_ci' OR table_collation IS NULL);
-- 执行后验证修改结果
SELECT
table_name,
table_collation
FROM information_schema.tables
WHERE table_schema = 'datebase_name'
AND table_type = 'BASE TABLE';
执行上述生成的ALTER TABLE语句即可完成表级字符集转换。
特殊处理:Quartz调度框架相关表
需要特别注意,如果数据库中使用了Quartz等任务调度框架的表,这些表通常包含外键约束,直接修改字符集会导致错误。处理这类表需要遵循“先解除约束,后修改字符集,最后重建约束”的流程:
-- 第一步:删除外键约束 ALTER TABLE `qrtz_triggers` DROP FOREIGN KEY `qrtz_triggers_ibfk_1`; ALTER TABLE `qrtz_simple_triggers` DROP FOREIGN KEY `qrtz_simple_triggers_ibfk_1`; ALTER TABLE `qrtz_cron_triggers` DROP FOREIGN KEY `qrtz_cron_triggers_ibfk_1`; ALTER TABLE `qrtz_simprop_triggers` DROP FOREIGN KEY `qrtz_simprop_triggers_ibfk_1`; ALTER TABLE `qrtz_blob_triggers` DROP FOREIGN KEY `qrtz_blob_triggers_ibfk_1`; -- 第二步:批量修改所有Quartz相关表的字符集 ALTER TABLE `qrtz_blob_triggers` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci; -- ...(此处省略其他表的修改语句,参考原文完整列表) -- 第三步:按原结构重新建立外键约束 ALTER TABLE `qrtz_triggers` ADD CONSTRAINT `qrtz_triggers_ibfk_1` FOREIGN KEY (`sched_name`) REFERENCES `qrtz_job_details`(`sched_name`); -- ...(此处省略其他约束的重建语句,参考原文完整列表)
总结与最佳实践
统一数据库字符集是解决此类隐式索引失效问题的根本方法,但操作本身存在一定风险。对于数据量较大的表,ALTER TABLE操作会锁定表结构,可能影响在线业务运行。因此,务必在业务低峰期执行此类操作,并且执行前必须做好完整的数据备份。数据安全永远是第一要务,谨慎操作至关重要。
本文完整复盘了一次由字符集不一致引发的SQL性能问题的排查与解决过程,为数据库开发者和DBA在排查类似“疑难杂症”时提供了清晰的思路和实用的解决方案。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
金仓数据库逻辑备份实战:全库导出与模式替换全流程
在长期的运维实践中,我越来越体会到,备份就像一份保险——平时看似无用,但关键时刻却是唯一的救命稻草。逻辑备份看似简单,可真正执行恢复时,各种陷阱接连浮现:表名大小写不一致、Schema 未正确切换、Owner 属性未同步修改……任何一个环节处理不当,最终恢复出的数据库就会与预期相去甚远。 本文将深入
金仓数据库sys_rman物理备份全流程演练与误覆盖恢复
干运维这行,逻辑备份和物理备份我都接触过,但说句实在话,真正能在生产环境里扛住事儿的,还得是物理备份。逻辑备份导出的是 SQL 语句,数据量一大,那速度慢得让人抓狂,而且最关键的是,它没法做时间点恢复。物理备份不一样,它直接拷贝数据文件,再配上 WAL 归档日志,想恢复到过去哪一秒都行,这是它最硬核
Windows下将MySQL注册为系统自启服务教程
先说一个关键前提:务必以管理员身份运行终端,否则 mysqld --install 这条命令几乎不可能成功。问题不在于命令写错,而是 Windows 系统的用户账户控制(UAC)机制会在中途拦截——在普通 CMD 或 PowerShell 窗口执行这条命令,要么直接提示 Access is deni
Mac版Navicat中快速对比两个数据库的表结构异同
直接说结论:Mac 版 Navicat 和 Windows 版在表结构比对逻辑上完全一致。但默认配置下,它确实无法承受“全库一键比对上万张表”的压力。要想避免卡死、内存溢出、进度条永远停在 0%,你必须手动将表分批处理,或者利用前缀过滤来控制扫描范围。 为什么 Mac 上点击「结构同步」后界面会卡住
MySQL中UNION操作推荐用UNION ALL的原因
MySQL中UNION与UNION ALL性能对比:别再被“保险”迷惑,差距远超预期 先给出核心结论:UNION ALL 的性能通常比 UNION 高出不止一个数量级。原因在于,UNION 在合并结果集后会自动触发去重操作,这往往伴随着隐式排序,进而产生临时表和文件排序。而 UNION ALL 则直
- 日榜
- 周榜
- 月榜
相关攻略
2026-07-03 07:08
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:06
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

