当前位置: 首页
数据库
SQL面试必考窗口函数实战 ROW_NUMBER与RANK的区别分析

SQL面试必考窗口函数实战 ROW_NUMBER与RANK的区别分析

热心网友 时间:2026-04-26
转载

ROW_NUMBER() 与 RANK():一字之差,逻辑天壤之别

SQL面试必考窗口函数实战 ROW_NUMBER与RANK的区别分析

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

ROW_NUMBER() 和 RANK() 的结果差异,根本不在写法,而在排序逻辑

许多开发者在编写SQL窗口函数时,语法看似正确,但查询结果却与预期不符。问题的根源往往不在于代码本身,而在于对ROW_NUMBER()和RANK()这两个核心函数的内在逻辑理解不足。它们对重复值的处理方式存在本质区别,这正是SQL面试和实际开发中的关键考点。

  • ROW_NUMBER() 严格按行分配唯一序号,无视数值是否相等。即使两行记录的salary字段完全相同(例如都是25000),它也会强制分配连续编号1和2。
  • RANK() 则遵循现实世界的排名规则:数值相同则名次并列,后续名次会跳过被占用的序号。例如,出现两个第一名后,下一个名次直接就是第三名。
  • 通过一个经典案例可以清晰对比:对数据集[90, 85, 85, 80]执行降序排名,SELECT score, ROW_NUMBER() OVER (ORDER BY score DESC), RANK() OVER (ORDER BY score DESC),两者的输出结果分别为[1,2,3,4][1,2,2,4]。这直观展示了SQL排名函数的核心差异。

选哪个?取决于你到底要“序号”还是“名次”

选择ROW_NUMBER()还是RANK(),绝非个人编码风格问题,而是直接关系到业务逻辑的准确性。用错函数可能导致数据分析结论完全错误。

  • 需要唯一序号时用ROW_NUMBER():例如,获取每个部门最新的一条订单记录。应使用ROW_NUMBER() OVER (PARTITION BY dept_id ORDER BY create_time DESC)生成序号,再通过WHERE rn = 1筛选。此场景要求序号绝对唯一,不允许并列。
  • 需要真实排名时用RANK():例如,制作销售业绩排行榜,且需处理并列情况。应使用RANK() OVER (ORDER BY amount DESC),配合WHERE rk <= 3筛选前三名。这样,如果两人并列第一,一人第三,查询结果将正确返回三条记录。
  • 常见误区警示:若错误地使用ROW_NUMBER()来实现“取前三名”,系统只会机械地返回前三行,所有并列的选手都会被遗漏。这是SQL面试和线上数据事故中的高频错误点,务必警惕。

常见踩坑点:别名不能直接在 WHERE 里用,PARTITION BY 写错就全乱了

窗口函数的使用存在几个典型陷阱。首先,由于SQL执行顺序(WHERE在SELECT之前计算),窗口函数生成的别名无法在同一查询层级的WHERE子句中直接引用。其次,PARTITION BY的分组维度一旦定义错误,整个排名逻辑将彻底失效。

  • 错误写法示例SELECT *, RANK() OVER (ORDER BY score) AS rk FROM scores WHERE rk <= 10。此语句将导致报错或逻辑混乱。
  • 正确解决方案:必须使用子查询或公共表表达式(CTE)进行嵌套,在外部查询中过滤。例如:SELECT * FROM (SELECT *, RANK() OVER (...) AS rk FROM scores) t WHERE t.rk <= 10
  • 分组维度核对:如果将PARTITION BY dept_id误写为PARTITION BY city

MySQL 8.0+ 性能提示:没特殊需求时,优先用 ROW_NUMBER()

在MySQL 8.0及以上版本的大数据量场景实测中,ROW_NUMBER()的性能通常比RANK()稳定高出10%~15%。这是因为RANK()需要额外的计算来识别重复值并确定跳号规则,开销更大。

  • 性能优先场景:如果业务需求仅为数据分页、结果去重、或获取不处理并列情况的Top N记录,那么ROW_NUMBER()是更轻量、更高效的选择。
  • 注意性能波动RANK()及其变体DENSE_RANK()在高并发的OLAP分析场景下,因其内部复杂的排序与缓存机制,可能导致性能波动。建议上线前进行充分的压力测试与对比。
  • 版本兼容性提醒:ROW_NUMBER、RANK、DENSE_RANK等标准窗口函数均要求MySQL版本在8.0或以上。低版本虽可通过用户变量模拟,但该方案在多线程或复杂查询中极易出错,存在较高风险,不推荐在生产环境使用。

总而言之,掌握窗口函数的关键,不在于死记OVER子句的语法,而在于深入思考一个根本问题:你当前业务场景需要的,究竟是按行读取的“流水号”,还是反映真实位次的“竞赛排名”?厘清这一点,才能做出最准确的技术选型。

来源:https://www.php.cn/faq/2307233.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
Redis主从复制数据同步性能瓶颈_排查主库磁盘IO与从库网络带宽

Redis主从复制数据同步性能瓶颈_排查主库磁盘IO与从库网络带宽

Redis主从同步性能瓶颈排查:当全量同步“卡”住时,你在看哪里? 主库 bgsa ve 卡住,其实是磁盘 IO 被拖垮了 遇到全量同步慢,第一反应往往是“网络不行”。但真相是,当问题卡在主库的 bgsa ve 阶段时,十有八九不是CPU算力不足,而是磁盘的写入速度彻底跟不上了。尤其是在使用机械硬盘

时间:2026-04-26 17:47
SQL如何通过视图解决多对多关联查询_构建中间层逻辑

SQL如何通过视图解决多对多关联查询_构建中间层逻辑

SQL如何通过视图解决多对多关联查询_构建中间层逻辑 为什么直接 JOIN 多对多表会出错 问题的根源在于,多对多关系本身没有天然的“主从”顺序。当你直接用JOIN连接关联表时,如果不加任何约束,中间表(比如user_role)就会触发笛卡尔积。举个例子,一个用户有3个角色,另一个用户有2个角色,查

时间:2026-04-26 17:46
Redis集群部署遇到端口冲突怎么办_合理规划集群端口与Bus总线端口

Redis集群部署遇到端口冲突怎么办_合理规划集群端口与Bus总线端口

Redis集群部署端口冲突解决方案:Bus端口占用导致节点握手失败与连接异常的排查与修复指南 Redis集群启动失败,节点之间无法建立连接,使用CLUSTER NODES命令查看节点状态时,持续显示fail或长时间停留在connecting状态——这类问题的根源通常指向端口冲突,而其中最常见且易被忽

时间:2026-04-26 17:46
mysql为何执行计划总是走全表扫描_分析优化器成本计算逻辑

mysql为何执行计划总是走全表扫描_分析优化器成本计算逻辑

MySQL执行计划为何总选全表扫描?深入优化器的成本计算逻辑 排查慢查询时,使用EXPLAIN命令查看执行计划,发现type=ALL赫然在目,但检查表结构却发现相关查询字段上明明建有索引。这种情况是否似曾相识?先别急着质疑数据库或索引的有效性,问题的根源很可能在于查询优化器的“成本决策”机制——它并

时间:2026-04-26 17:46
mysql集群数据同步问题_InnoDB与MyISAM在同步中差异

mysql集群数据同步问题_InnoDB与MyISAM在同步中差异

MySQL主从复制中,引擎选择如何悄然影响数据一致性? 在MySQL主从复制的世界里,InnoDB和MyISAM的行为差异,常常是导致同步异常或数据不一致的根源。这往往不是简单的配置失误,而是由两种存储引擎底层的核心机制决定的。理解这些差异,是构建可靠数据同步架构的第一步。 主从复制下 MyISAM

时间:2026-04-26 17:46
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程