监控mysql主从同步状态
在高并发网站架构中,MySQL数据库主从同步是不可或缺的,不过经常会发生由于网络原因或者操作错误,MySQL主从经常会出现不同步的情况,那么如何监控MySQL主从同步,也变成网站正常运行的重要环节。
MySQL同步功能由3个线程(master上1个,slave上2个)来实现,简单的说就是:master发送日志一个,slave接收日志一个,slave运行日志一个。
首先,我们解释一下 show slave status 中重要的几个参数:
Slave_IO_Running: I/O线程是否被启动并成功地连接到主服务器上。
Slave_SQL_Running: SQL线程是否被启动。
Seconds_Behind_Master:和主库比同步延迟的秒数
本字段是从属服务器“落后”多少的一个指示。当从属SQL线程正在运行时(处理更新),本字段为在主服务器上由此线程执行的最近的一个事件的时间标记开始,已经过的秒数。当此线程被从属服务器I/O线程赶上,并进入闲置状态,等待来自I/O线程的更多的事件时,本字段为零。总之,本字段测量从属服务器SQL线程和从属服务器I/O线程之间的时间差距,单位以秒计。
如何监控从服务器是否正常运行呢?
[root@slave ~]# mysql -u root -proot -e "show slave status\G;" *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 192.168.0.31 #当前的mysql master服务器主机 Master_User: myslave Master_Port: 3306 Connect_Retry: 60 Master_Log_File: master-bin.000003 Read_Master_Log_Pos: 471 Relay_Log_File: relay-log-bin.000002 Relay_Log_Pos: 252 Relay_Master_Log_File: master-bin.000003 Slave_IO_Running: Yes #I/O线程是否被启动并成功地连接到主服务器上。 Slave_SQL_Running: Yes #SQL线程是否被启动。 Master_SSL_Key: Seconds_Behind_Master: 0 #和主库比同步延迟的秒数
下面编写shell脚本监控mysql主从同步,实现如下功能:
阶段1:开发一个守护进程脚本每30秒实现检测一次。
阶段2:如果同步出现如下错误号(1158,1159,1008,1007,1062),请跳过错误
阶段3:请使用数组技术实现上述脚本(获取主从判断及错误号部分)
#!/bin/bash mysql_cmd="mysql -u root -proot" errornum=(1158 1159 1008 1007 1062) while true do array=($($mysql_cmd -e "show slave status\G"|egrep ‘_Running|Behind_Master|Last_SQL_Errno‘|awk ‘{print $NF}‘)) if [ "${array[0]}" == "Yes" -a "${array[1]}" == "Yes" -a "${array[2]}" == "0" ] then echo "MySQL is slave is running" else for ((i=0;i<${#errornum[*]};i++)) do if [ "${array[3]}" = "${errornum[$i]}" ];then $mysql_cmd -e "stop slave &&set global sql_slave_skip_counter=1;start slave;" fi done char="MySQL slave is downed" echo "$char" echo "$char"|mail -s "$char" xxxxx@qq.com break fi sleep 30 done
示例一: cat check_mysql_health #!/bin/sh slave_is=($(mysql -S /tmp/mysql3307.sock -uroot -e "show slave status\G"|grep "Slave_.*_Running" |awk '{print $2}')) if [ "${slave_is[0]}" = "Yes" -a "${slave_is[1]}" = "Yes" ] then echo "OK SDK-slave3307 connect master3306 is running" exit 0 else echo "Critical SDK-slave3307 connect master3306 is not running" exit 2 fi
示例二: [root@slavedb test]# cat Check_Mysql_Synchronization.sh #!/bin/bash MYUSER=root MYSOCKET=/tmp/mysql3306.sock MYPASSWD= MYLOGIN="mysql -S $MYSOCKET -u$MYUSER " ERROR=(1158 1159 1008 1007 1062 1050) check_status(){ STATUS=($($MYLOGIN -e "show slave status\G"|egrep "Slave_SQL_Running|Slave_IO_Running|Seconds_Behind_Master|Last_SQL_Errno"|awk '{print $NF}')) if [ "${STATUS[0]}" = "Yes" -a "${STATUS[1]}" = "Yes" -a "${STATUS[2]} = 0" ];then echo "Mysql Slave is Ok!" CHECK_NUM=0 return $CHECK_NUM else CHECK_NUM=1 return $CHECK_NUM fi } check_error(){ check_status if [ $? -eq 1 ];then for ((i=0;i<${#ERROR[*]};i++));do if [ "${ERROR[i]}" == "${STATUS[3]}" ];then $MYLOGIN -e "stop slave;" $MYLOGIN -e "set global sql_slave_skip_counter=1" $MYLOGIN -e "start slave;" fi done fi } check_again(){ STATUS=($($MYLOGIN -e "show slave status\G"|egrep "Slave_SQL_Running|Slave_IO_Running|Seconds_Behind_Master|Last_SQL_Errno"|awk '{print $NF}')) check_status >/dev/null 2&>1 if [ $? -eq 1 ];then echo "Mysql slave is fail $(date +%F)" fi } main(){ while true;do check_error check_again sleep 10 done } main
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2019-10-14 Select count(*)和Count(1)的区别和执行方式
2019-10-14 为什么SQL语句Where 1=1 and在SQL Server中不影响性能
2019-10-14 浅谈SQL Server内部运行机制
2019-10-14 SQL Server 10分钟理解游标
2019-10-14 Windows 创建Raid