MySQL主从中断常见原因解析与排查方案
当一个异常庞大的事务(包含单个或多个数据包)的尺寸超过了特定参数的大小时,该事务会暂时被保留。直到所有工作线程都清空了待处理队列,系统才会开始处理这个大型事务。在此期间,后续所有事务都会被保存起来,直到那个庞大事务最终处理完毕。这个过程有可能导致主从复制链路出现延迟。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在生产环境中,为了确保数据库服务的高可用性,MySQL 通常会采用主从复制架构。常见的部署模式包括双向复制架构,或者是一主一从、一主多从的架构。
在主从复制架构的运行过程中,同样可能遭遇各种问题,例如复制同步中断。
本文旨在梳理常见的复制中断原因,并提供相应的解决方法。
1. 主键冲突
遇到主键冲突时,通常会看到类似下面的错误信息,错误代码为1062。
Could not execute Write_rows event on table xxx; Duplicate entry ‘xxx’ for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY......
对于主键冲突错误,一般的解决方法是直接在从库中找到并删除重复的记录即可。需要特别注意的是,删除前最好先备份数据,以备将来可能需要进行数据恢复。
2. 记录不存在
常见的“记录不存在”错误示例如下:
Could not execute Update_rows event on table xxx; Can't find record in ‘xxx’, Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND......
或是:
Could not execute Delete_rows event on table xxx; Can't find record in ‘xxx’, Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND......
对于1032错误,解决思路是依据报错信息,前往主库解析对应的binlog日志,找到那条具体的记录,然后手动插入到从库中。如果是在双向复制链路上操作,务必记得需要在会话级别临时关闭binlog写入,以避免操作形成循环。
无论是1062还是1032错误,大部分情况下都源自不规范的操作,例如人为直接在从库上进行了写入。因此,在生产环境中强烈建议将从库设置为只读模式。
3. 主库binlog丢失
主从同步错误码1236是我们所熟悉的,导致主库binlog不存在的报错原因可能包括:
从库未能及时同步主库的binlog,而主库的binlog由于时间过久已被自动清理。有人为在主库手动执行了purge binlog操作或直接删除了binlog文件。人为在主库误执行了reset master命令。请牢记,这是一项高风险操作。
报错信息如下:
Got fatal error 1236 from master when reading data from binary log...but the master has purged binary logs containing GTIDs that the slave requires
对于这种场景,通常只能选择对从库进行重建操作,没有其他捷径。
4. Relay Log损坏
中继日志(Relay Log)的损坏同样会导致主从同步中断,报错信息类似:
Last_SQL_Error:Error initializing relay log postion: I/O error reading the header from the binary logLast_SQL_Error:Error initializing relay log positon:Binlog has bad magic number:it’s not a binary log file that can be used by this version of MySQL.
从库服务器宕机、非法关机、电源故障、硬件故障等场景都有可能造成中继日志的损坏。
相应的解决方法是执行reset slave命令重置relay log。对于传统的基于位点的复制模式,需要依据Relay_Master_Log_File和Exec_Master_Log_Pos这两个变量的值来确定已经同步到的位置,并从这两个位置重新配置同步。
5. 参数问题
部分参数的配置不当也会导致同步中断,例如,可能看到如下报错:
Last_Error: Cannot schedule event Update_rows, relay-log name ...to Worker thread because its size 50450016 exceeds 16777216 of slave_pending_jobs_size_max
导致上述报错的原因是主从同步过程中,slave_pending_jobs_size_max参数的设置值过小。只需调大该参数即可,调整后需要重启复制进程。
slave_pending_jobs_size_max参数在MySQL 5.6版本后引入,默认单位是字节。如果未开启多线程复制,则此参数无效。其默认值为16MB,最大可设置为1GB。
需要注意的是,从库中此参数的值需要等于或大于主库的max_allowed_packet参数值,否则从库的工作队列可能会被填满。
另外,如果一个异常庞大的事件(包含一个或多个数据包)的大小超过了此参数的限制,该事件会被暂存,直到所有工作线程都有空余队列后才会进行处理。所有后续事件也会被保存,直到那个大事件完成。这可能会加剧主从链路的延迟。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
美监管机构终止对特斯拉智能召唤功能的调查
IT之家 4 月 7 日消息,美国汽车安全监管机构结束了针对特斯拉名为“真智能召唤(Actually Smart Summon)”的远程泊车功能的调查,原因是调查发现相关碰撞事故极为罕见,且均为低速
【早知道】苹果首款折叠屏手机已在试产;我国成立太空算力产业协同平台
人民财讯4月7日电,【摘要】伊朗称不会为暂时停火而重新开放霍尔木兹海峡。六部门:发展“人工智能+电商”,引导电商企业加强人工智能大模型等技术研发应用。工信部:强化协同、创新、应用,扎实有序推动太空算
苹果iOS 26液态玻璃设计展示库更新,展示第三方应用适配效果
IT之家 4 月 7 日消息,苹果正持续推广其在 iOS 26、iPadOS 26 与 macOS 26 中推出的液态玻璃视觉设计风格。该公司发布了更新版的液态玻璃设计展示库,展示了这一设计在第三方
三星电子第一季度业绩暴增
三星电子发布了第一季度初步业绩报告,预计其营业利润将达到57 2万亿韩元,较去年同期的6 69万亿韩元增长了八倍以上。这一业绩远超市场预期的40 6万亿韩元,主要归功于人工智能基础设施建设引发的芯片
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程

