MySQL高可用性大杀器之MHA
提到MySQL高可用性,很多人会想到MySQL Cluster,亦或者Heartbeat+DRBD,不过这些方案的复杂性常常让人望而却步,与之相对,利用MySQL复制实现高可用性则显得容易很多,目前大致有MMM,PRM,MHA等方案可供选择:MMM是最常见的方案,可惜它问题太多(What’s wrong with MMM,Problems with MMM for MySQL);至于PRM,它还是个新项目,暂时不推荐用于产品环境,不过作为Percona的作品,它值得期待;如此看来目前只能选MHA了,好在经过DeNA大规模的实践应用证明它是个靠谱的工具。
安装:
作为前提条件,应先配置MySQL复制,并设置SSH公钥免密码登录。下面以CentOS为例来说明,最好先安装EPEL,不然YUM可能找不到某些软件包。
MHA由Node和Manager组成,Node运行在每一台MySQL服务器上,也就是说,不管是MySQL主服务器,还是MySQL从服务器, 都要安装Node,而Manager通常运行在独立的服务器上,但如果硬件资源吃紧,也可以用一台MySQL从服务器来兼职Manager的角色。
安装Node:
1
2
|
shell> yum install perl-DBD-MySQL shell> rpm -Uvh http: //mysql-master-ha .googlecode.com /files/mha4mysql-node-0 .52-0.noarch.rpm |
安装Manager:
1
2
3
4
5
6
|
shell> yum install perl-DBD-MySQL shell> yum install perl-Config-Tiny shell> yum install perl-Log-Dispatch shell> yum install perl-Parallel-ForkManager shell> rpm -Uvh http: //mysql-master-ha .googlecode.com /files/mha4mysql-node-0 .52-0.noarch.rpm shell> rpm -Uvh http: //mysql-master-ha .googlecode.com /files/mha4mysql-manager-0 .52-0.noarch.rpm |
配置:
配置全局设置:
1
2
3
4
5
|
shell> cat /etc/masterha_default .cnf [server default] user=... password=... ssh_user=... |
配置应用设置:
1
2
3
4
5
6
|
shell> cat /etc/masterha_application .cnf [server_1] hostname =... [server_2] hostname =... |
注:MHA配置文件中参数的详细介绍请参考官方文档。
检查
检查MySQL复制:
1
|
shell> masterha_check_repl --conf= /etc/masterha_application .cnf |
检查SSH公钥免密码登录:
1
|
shell> masterha_check_ssh --conf= /etc/masterha_application .cnf |
实战
首先启动MHA进程:
1
|
shell> masterha_manager --conf= /etc/masterha_application .cnf |
注:视配置情况而定,可能会提示read_only,relay_log_purge等警告信息。
然后检查MHA状态:
1
|
shell> masterha_check_status --conf= /etc/masterha_application .cnf |
注:如果正常,会显示『PING_OK』,否则会显示『NOT_RUNNING』。
到此为止,一个基本的MHA例子就能正常运转了,不过一旦当前的MySQL主服务器发生故障,MHA把某台MySQL从服务器提升为新的MySQL主服务器后,如何通知应用呢?这就需要在配置文件里加上如下两个参数:
说到Failover,通常有两种方式:一种是虚拟IP地址,一种是全局配置文件。MHA并没有限定使用哪一种方式,而是让用户自己选择,虚拟IP地址的方式会牵扯到其它的软件,这里就不赘述了,以下简单说说全局配置文件,以PHP为实现语言,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
|
#!/usr/bin/env php <?php $longopts = array ( 'command:' , 'ssh_user:' , 'orig_master_host:' , 'orig_master_ip:' , 'orig_master_port:' , 'new_master_host::' , 'new_master_ip::' , 'new_master_port::' , ); $options = getopt (null, $longopts ); if ( $options [ 'command' ] == 'start' ) { $params = array ( 'ip' => $options [ 'new_master_ip' ], 'port' => $options [ 'new_master_port' ], ); $string = '<?php return ' . var_export( $params , true) . '; ?>' ; file_put_contents ( 'config.php' , $string , LOCK_EX); } exit (0); ?> |
注:用其它语言实现这个脚本也是OK的,最后别忘了给脚本加上可执行属性。
如果要测试效果的话,可以kill掉当前的MySQL主服务器,稍等片刻,MHA就会把某台MySQL从服务器提升为新的MySQL主服务器,并调 用master_ip_failover_script脚本,如上所示,我们在master_ip_failover_script脚本里可以把新的 MySQL主服务器的ip和port信息持久化到配置文件里,这样应用就可以使用新的配置了。
有时候需要手动切换MySQL主服务器,可以使用masterha_master_switch命令,不过它调用的不是master_ip_failover_script脚本,而是master_ip_online_change_script脚本,但调用参数类似,脚本可以互用。
1
2
|
shell> masterha_master_switch --conf= /etc/masterha_application .cnf --master_state=dead --dead_master_host=... shell> masterha_master_switch --conf= /etc/masterha_application .cnf --master_state=alive --new_master_host=... |
注:针对原来的MySQL主服务器是否已经宕机,执行命令所需的参数有所不同。
需要说明的是,缺省情况下,如果MHA检测到连续发生宕机,且两次宕机时间间隔不足八小时的话,则不会进行Failover,之所以这样限制是为了避免ping-pong效应。不过为了自动化,我们往往希望能取消这种限制,此时可以用如下方式启动Manager:
1
|
shell> nohup masterha_manager --conf= /etc/masterha_application .cnf --ignore_last_failover --remove_dead_master_conf & |
注:请确保Manager的运行用户对masterha_application.cnf有写权限。
…
本文只是MHA的一个简要介绍,至于详细说明,建议大家阅读官方文档。