当前位置: 首页
数据库
MySQL中UNION操作推荐用UNION ALL的原因

MySQL中UNION操作推荐用UNION ALL的原因

热心网友 时间:2026-07-03
转载

MySQL中UNION与UNION ALL性能对比:别再被“保险”迷惑,差距远超预期

先给出核心结论:UNION ALL 的性能通常比 UNION 高出不止一个数量级。原因在于,UNION 在合并结果集后会自动触发去重操作,这往往伴随着隐式排序,进而产生临时表和文件排序。而 UNION ALL 则直接将各个子查询的结果拼接在一起,完全不干预数据内容。从执行计划视角来看,UNION 等价于 UNION ALL 再套一层 DISTINCT,这直接导致了 Using temporaryUsing filesort 的出现,I/O 和 CPU 开销自然显著攀升。

为什么MySQL在执行UNION操作时建议使用UNION ALL?

UNION ALL 速度远超 UNION:无需去重,性能飙升

性能差距究竟有多大?举例说明:两个各返回 50 万行的子查询,用 UNION ALL 可能在 200 毫秒内流式返回,数据像流水般从数据库吐出。而 UNION 则会卡在 Using temporary; Using filesort 上,耗时数秒甚至直接导致内存溢出(OOM)。

如果你的查询出现以下情况,基本可以断定是 UNION 的去重逻辑在作祟:

  • 执行计划里出现了 Using temporaryUsing filesort
  • 查询响应时间随结果集增长呈现非线性飙升
  • 临时表空间(tmp_table_size / max_heap_table_size)被频繁打满

UNION 可能悄然改变结果行数与顺序,需警惕

这一特性非常隐蔽,但潜在影响不容小觑。只要任意两行在所有列上完全相等,UNION 就会毫不留情地剔除一个。哪怕这两行来自不同业务表——比如“正式员工”和“外包人员”里都叫“张三”、部门也相同——也会被当作重复行过滤掉。这不是 bug,这就是 UNION 的设计行为。

更令人头疼的是顺序问题。UNION 的去重过程,在 MySQL 8.0 以前尤为明显,会伴随隐式排序,导致最终结果的顺序完全不可控。而 UNION ALL 至少能忠实地保持各子查询的原始输出顺序——除非你显式加上 ORDER BY

来看几个典型应用场景,就能清楚何时该用哪个:

  • 合并按天分表的日志(如 log_20260501, log_20260502……)—— 数据天然不重复,直接用 UNION ALL
  • 跨库汇总用户注册数 —— 各库 ID 独立,不可能重复,用 UNION ALL
  • 补全缺失维度值(如左连接后用 UNION ALL 加默认分类)—— 明确要保留所有行,用 UNION ALL

列对齐、类型兼容及 ORDER BY 写法需严格遵守规则

无论是 UNION 还是 UNION ALL,它们都不是“智能拼接”,只认位置,不认字段名。下面这些写法,MySQL 都会直接报错:

  • SELECT name, id FROM t1 UNION SELECT id, name FROM t2 —— 列顺序错乱,第一列拼的是 t1.namet2.id,语义完全混乱
  • SELECT created_at FROM orders UNION SELECT order_time FROM history —— 类型不兼容,如 DATETIMETIMESTAMP 在某些版本会直接报错
  • SELECT x FROM a ORDER BY x LIMIT 10 UNION SELECT y FROM b ORDER BY y LIMIT 10 —— 语法非法,MySQL 会抛出 ERROR 1221

正确做法是什么?

  • 统一用 CAST()CONVERT(... USING utf8mb4) 显式转换数据类型
  • 所有子查询的列数、顺序、别名必须完全一致。例如,统一写成 SELECT id AS uid, name AS fullname FROM ...
  • ORDER BY 只能放在整个查询的最后,并且只能引用列名或位置序号:... UNION ALL ... ORDER BY fullname
  • 如果希望每个子查询各自取 top N,则需要包一层子查询:(SELECT ... ORDER BY x LIMIT 10) UNION ALL (SELECT ... ORDER BY y LIMIT 10)

何时真正应该使用 UNION?理性判断而非凭感觉

只有当以下条件全部满足时,才值得考虑 UNION

  • 业务逻辑明确要求结果中每行全局唯一(比如合并多个来源的用户 ID,且 ID 是主键)
  • 你无法在子查询里通过 WHEREJOIN 提前排重
  • 数据量不大,或已经确认去重开销完全可控(如总行数在几千以内)

如果只是“怕有重复所以保险起见”,反而容易埋下隐患。例如某天上游数据逻辑变更,导致本不该去重的行被意外合并,这种问题回溯起来非常困难。更稳妥的做法是:先用 UNION ALL 查出全量数据,再用 SELECT DISTINCT 包一层。虽然性能可能稍差,但语义清晰、可调试,出了问题也容易定位。

最后,还有一个极易被忽略的细节:即使两个表结构一模一样,UNION 也会把 NULLNULL 当作相等去重。但在很多业务场景里,NULL 的语义是“未知”,而非“相同”。这一点在统计类查询中,很容易引发数据偏差,需要格外警惕。

来源:https://www.php.cn/faq/2747396.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
金仓数据库逻辑备份实战:全库导出与模式替换全流程

金仓数据库逻辑备份实战:全库导出与模式替换全流程

在长期的运维实践中,我越来越体会到,备份就像一份保险——平时看似无用,但关键时刻却是唯一的救命稻草。逻辑备份看似简单,可真正执行恢复时,各种陷阱接连浮现:表名大小写不一致、Schema 未正确切换、Owner 属性未同步修改……任何一个环节处理不当,最终恢复出的数据库就会与预期相去甚远。 本文将深入

时间:2026-07-03 07:08
金仓数据库sys_rman物理备份全流程演练与误覆盖恢复

金仓数据库sys_rman物理备份全流程演练与误覆盖恢复

干运维这行,逻辑备份和物理备份我都接触过,但说句实在话,真正能在生产环境里扛住事儿的,还得是物理备份。逻辑备份导出的是 SQL 语句,数据量一大,那速度慢得让人抓狂,而且最关键的是,它没法做时间点恢复。物理备份不一样,它直接拷贝数据文件,再配上 WAL 归档日志,想恢复到过去哪一秒都行,这是它最硬核

时间:2026-07-03 07:07
Windows下将MySQL注册为系统自启服务教程

Windows下将MySQL注册为系统自启服务教程

先说一个关键前提:务必以管理员身份运行终端,否则 mysqld --install 这条命令几乎不可能成功。问题不在于命令写错,而是 Windows 系统的用户账户控制(UAC)机制会在中途拦截——在普通 CMD 或 PowerShell 窗口执行这条命令,要么直接提示 Access is deni

时间:2026-07-03 07:07
Mac版Navicat中快速对比两个数据库的表结构异同

Mac版Navicat中快速对比两个数据库的表结构异同

直接说结论:Mac 版 Navicat 和 Windows 版在表结构比对逻辑上完全一致。但默认配置下,它确实无法承受“全库一键比对上万张表”的压力。要想避免卡死、内存溢出、进度条永远停在 0%,你必须手动将表分批处理,或者利用前缀过滤来控制扫描范围。 为什么 Mac 上点击「结构同步」后界面会卡住

时间:2026-07-03 07:07
MySQL中UNION操作推荐用UNION ALL的原因

MySQL中UNION操作推荐用UNION ALL的原因

MySQL中UNION与UNION ALL性能对比:别再被“保险”迷惑,差距远超预期 先给出核心结论:UNION ALL 的性能通常比 UNION 高出不止一个数量级。原因在于,UNION 在合并结果集后会自动触发去重操作,这往往伴随着隐式排序,进而产生临时表和文件排序。而 UNION ALL 则直

时间:2026-07-03 07:07
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜