带你了解zabbix如何监控mysql主从到报警触发
本章博客我们一起来聊一聊如何监控mysql数据库主从状态?
思路梳理:
1)首先我们都知道,判断Mysql主从是否正常,是通过主从上面的SQL和IO线程都为yes状态判断(通过awk取值,grep过滤和统计yes的个数,如果为2则为正常值),随后我们取值得脚本或者命令写入zabbix-agent端的配置文件中的“Userparamenter”,格式 为:Userparamenter [自定义 键值] ,[脚本或者命令参数]
2)我们zabbix没有监控主从的模板和监控项,所以我们需要自己定义添加,创建监控项和图形都是可以的
3)创建完成之后,我们可以为zabbix主从状态定义监控报警
下面是主从之前的配置,在这里就不在详细的阐述了,如果主从不熟悉的童鞋可以参考一下即可
mysql-master端: [root@mysql-master]# vim /etc/my.cnf server-id =1 log-bin=/var/lib/mysql/mysql-bin root@mysql-master # /etc/init.d/mysqld restart mysql> grant replication slave on *.* to 'xiaoyu'@'192.168.17.138' identified by '123.com'; Query OK, 0 rows affected (0.00 sec) mysql> flush privileges; mysql> show master status; +------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +------------------+----------+--------------+------------------+ | mysql-bin.000001 | 339 | | | +------------------+----------+--------------+------------------+ 1 row in set (0.00 sec) mysql-slave端 [root@mysql-slave]# vim /etc/my.cnf server-id =2 log-bin=/var/lib/mysql/mysql-bin [root@mysql-slave~]# /etc/init.d/mysqld restart mysql> slave stop; Query OK, 0 rows affected, 1 warning (0.00 sec) mysql> change master to -> master_host='192.168.17.129', -> master_user='xiaoyu', -> master_password='123.com', -> master_log_file='mysql-bin.000001', -> master_log_pos=339; Query OK, 0 rows affected (0.06 sec) mysql> slave start; Query OK, 0 rows affected (0.00 sec) mysql> show slave status\G *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 192.168.17.129 Master_User: xiaoyu Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000001 Read_Master_Log_Pos: 339 Relay_Log_File: mysqld-relay-bin.000002 Relay_Log_Pos: 251 Relay_Master_Log_File: mysql-bin.000001 Slave_IO_Running: Yes Slave_SQL_Running: Yes
一:首先在Mysql-slave端创建mysql主从项取值
2)#测试 通过grep过滤出关键词"Running"状态,awk打印出第二列的"Yes",最后由grep -c统计“Yes”的个数
[root@mysql-slave ~]# mysql -u root -p123456 -e "show slave status\G" | grep "Running" |awk "{print $2}" | grep -c "Yes"
2
2)将这条语句写入agent.conf配置文件中
[root@mysql-slave ~]# vim /usr/local/zabbix/etc/zabbix_agentd.conf
UserParameter=mysql.replication,mysql -u root -p123456 -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes"
[root@mysql-slave ~]# /etc/init.d/zabbix_agent restart
最后在zabbix-server端抓取mysql-slave端的数据
[root@zabbix-server ~]# /usr/local/zabbix/bin/zabbix_get -s 192.168.17.138 -k mysql.replication #抓取mysql-slave端的键值,如果返回数值2.则表明IO和SQL线程状态都为yes状态,则表明主从正常
二:【Zabbix-server-web端配置】
2.1:创建一个监控项作为mysql主从
2.2:创建mysql主从监控图形
三:【创建触发器,实现主从异常报警】
到目前为止 ,我们的mysql主从到主从邮件报警设置一条龙服务已经完成,接下来测试一下,临时关闭mysql从的slave stop`
OK(ps:之前已经邮件服务报警此时,报警直接触发)
【生产环境遇到的坑 】
当我在server端执行zabbix_get测试检查是否获取到key值,却提示无法通过套接字“/opt/mysql/data/mysql.sock”连接到本地MySQL服务
zabbix_get获取agent自定义的key值和mysql.sock有什么关系呢?难道在agent端不存在sock文件?答应肯定是存在的,并且我测试了一下agent的普通key值system.uname,是正常获取的,说明在通信这一块是没问题的。
另外,我们把焦点看下权限,这个数据库授权获取key值都是通过zabbix这个普通用户的
我们在看下agent段的zabbix用户是存在的,只不过是被禁止shell登陆,这倒是没关系
Ps:在这里我们给予zabbix登录权限,切换到zabbix普通用户,以普通zabbix用户在本地执行/usr/bin/mysql -uzabbix -pzabbix -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes",会发现也会报mysql.sock问题,但是以管理员的身份能正常获取;
此时,我们在zabbix.conf配置文件中做修改,也就是加上sudo 以普通用户zabbix获取key值数据
mysql.replication,sudo /usr/bin/mysql -uzabbix -pzabbix -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes"
修改完成之后,再次执行zabbix_get,之前的错误没有了,新问题有出现了,提示sudo: sorry, you must have a tty to run sudo
此时我们只需要在agent端修改/etc/sudoers配置文件即可
1)Defaults requiretty,修改为 #Defaults requiretty,表示不需要控制终端。
2)允许zabbx普通用户执行mysql命令调用key值
到此为之结束!