MySQL中UNION操作推荐用UNION ALL的原因
MySQL中UNION与UNION ALL性能对比:别再被“保险”迷惑,差距远超预期
先给出核心结论:UNION ALL 的性能通常比 UNION 高出不止一个数量级。原因在于,UNION 在合并结果集后会自动触发去重操作,这往往伴随着隐式排序,进而产生临时表和文件排序。而 UNION ALL 则直接将各个子查询的结果拼接在一起,完全不干预数据内容。从执行计划视角来看,UNION 等价于 UNION ALL 再套一层 DISTINCT,这直接导致了 Using temporary 和 Using filesort 的出现,I/O 和 CPU 开销自然显著攀升。

UNION ALL 速度远超 UNION:无需去重,性能飙升
性能差距究竟有多大?举例说明:两个各返回 50 万行的子查询,用 UNION ALL 可能在 200 毫秒内流式返回,数据像流水般从数据库吐出。而 UNION 则会卡在 Using temporary; Using filesort 上,耗时数秒甚至直接导致内存溢出(OOM)。
如果你的查询出现以下情况,基本可以断定是 UNION 的去重逻辑在作祟:
- 执行计划里出现了
Using temporary或Using filesort - 查询响应时间随结果集增长呈现非线性飙升
- 临时表空间(
tmp_table_size/max_heap_table_size)被频繁打满
UNION 可能悄然改变结果行数与顺序,需警惕
这一特性非常隐蔽,但潜在影响不容小觑。只要任意两行在所有列上完全相等,UNION 就会毫不留情地剔除一个。哪怕这两行来自不同业务表——比如“正式员工”和“外包人员”里都叫“张三”、部门也相同——也会被当作重复行过滤掉。这不是 bug,这就是 UNION 的设计行为。
更令人头疼的是顺序问题。UNION 的去重过程,在 MySQL 8.0 以前尤为明显,会伴随隐式排序,导致最终结果的顺序完全不可控。而 UNION ALL 至少能忠实地保持各子查询的原始输出顺序——除非你显式加上 ORDER BY。
来看几个典型应用场景,就能清楚何时该用哪个:
- 合并按天分表的日志(如
log_20260501,log_20260502……)—— 数据天然不重复,直接用UNION ALL - 跨库汇总用户注册数 —— 各库 ID 独立,不可能重复,用
UNION ALL - 补全缺失维度值(如左连接后用
UNION ALL加默认分类)—— 明确要保留所有行,用UNION ALL
列对齐、类型兼容及 ORDER BY 写法需严格遵守规则
无论是 UNION 还是 UNION ALL,它们都不是“智能拼接”,只认位置,不认字段名。下面这些写法,MySQL 都会直接报错:
SELECT name, id FROM t1 UNION SELECT id, name FROM t2—— 列顺序错乱,第一列拼的是t1.name和t2.id,语义完全混乱SELECT created_at FROM orders UNION SELECT order_time FROM history—— 类型不兼容,如DATETIME和TIMESTAMP在某些版本会直接报错SELECT x FROM a ORDER BY x LIMIT 10 UNION SELECT y FROM b ORDER BY y LIMIT 10—— 语法非法,MySQL 会抛出ERROR 1221
正确做法是什么?
- 统一用
CAST()或CONVERT(... USING utf8mb4)显式转换数据类型 - 所有子查询的列数、顺序、别名必须完全一致。例如,统一写成
SELECT id AS uid, name AS fullname FROM ... ORDER BY只能放在整个查询的最后,并且只能引用列名或位置序号:... UNION ALL ... ORDER BY fullname- 如果希望每个子查询各自取 top N,则需要包一层子查询:
(SELECT ... ORDER BY x LIMIT 10) UNION ALL (SELECT ... ORDER BY y LIMIT 10)
何时真正应该使用 UNION?理性判断而非凭感觉
只有当以下条件全部满足时,才值得考虑 UNION:
- 业务逻辑明确要求结果中每行全局唯一(比如合并多个来源的用户 ID,且 ID 是主键)
- 你无法在子查询里通过
WHERE或JOIN提前排重 - 数据量不大,或已经确认去重开销完全可控(如总行数在几千以内)
如果只是“怕有重复所以保险起见”,反而容易埋下隐患。例如某天上游数据逻辑变更,导致本不该去重的行被意外合并,这种问题回溯起来非常困难。更稳妥的做法是:先用 UNION ALL 查出全量数据,再用 SELECT DISTINCT 包一层。虽然性能可能稍差,但语义清晰、可调试,出了问题也容易定位。
最后,还有一个极易被忽略的细节:即使两个表结构一模一样,UNION 也会把 NULL 和 NULL 当作相等去重。但在很多业务场景里,NULL 的语义是“未知”,而非“相同”。这一点在统计类查询中,很容易引发数据偏差,需要格外警惕。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
金仓数据库逻辑备份实战:全库导出与模式替换全流程
在长期的运维实践中,我越来越体会到,备份就像一份保险——平时看似无用,但关键时刻却是唯一的救命稻草。逻辑备份看似简单,可真正执行恢复时,各种陷阱接连浮现:表名大小写不一致、Schema 未正确切换、Owner 属性未同步修改……任何一个环节处理不当,最终恢复出的数据库就会与预期相去甚远。 本文将深入
金仓数据库sys_rman物理备份全流程演练与误覆盖恢复
干运维这行,逻辑备份和物理备份我都接触过,但说句实在话,真正能在生产环境里扛住事儿的,还得是物理备份。逻辑备份导出的是 SQL 语句,数据量一大,那速度慢得让人抓狂,而且最关键的是,它没法做时间点恢复。物理备份不一样,它直接拷贝数据文件,再配上 WAL 归档日志,想恢复到过去哪一秒都行,这是它最硬核
Windows下将MySQL注册为系统自启服务教程
先说一个关键前提:务必以管理员身份运行终端,否则 mysqld --install 这条命令几乎不可能成功。问题不在于命令写错,而是 Windows 系统的用户账户控制(UAC)机制会在中途拦截——在普通 CMD 或 PowerShell 窗口执行这条命令,要么直接提示 Access is deni
Mac版Navicat中快速对比两个数据库的表结构异同
直接说结论:Mac 版 Navicat 和 Windows 版在表结构比对逻辑上完全一致。但默认配置下,它确实无法承受“全库一键比对上万张表”的压力。要想避免卡死、内存溢出、进度条永远停在 0%,你必须手动将表分批处理,或者利用前缀过滤来控制扫描范围。 为什么 Mac 上点击「结构同步」后界面会卡住
MySQL中UNION操作推荐用UNION ALL的原因
MySQL中UNION与UNION ALL性能对比:别再被“保险”迷惑,差距远超预期 先给出核心结论:UNION ALL 的性能通常比 UNION 高出不止一个数量级。原因在于,UNION 在合并结果集后会自动触发去重操作,这往往伴随着隐式排序,进而产生临时表和文件排序。而 UNION ALL 则直
- 日榜
- 周榜
- 月榜
相关攻略
2026-07-03 07:08
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:07
2026-07-03 07:06
2026-07-03 07:06
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

