Heartbeat高可用解决方案
Heartbeat高可用
Heartbeat作用:
通过heartbeat,可以将资源(ip以及程序服务等资源)从一台已经故障的计算机快速转移到另一台正常运转的机器上继续提供服务,一般称之为高可用服务。
heartbeat和keepalived有很多相同之处,但是也有区别。
官方网址:http://www.linux-ha.org/wiki/Main_Page
工作原理:
通过修改heartbeat的配置文件,可以指定一台heartbeat服务器作为主服务器,另一台自动成为热备服务器。在热备服务器上面配置heartbeat守护程序来监听来自主服务器的心跳信息。如果在规定时间内,无法监听到心跳信息,那么就启动故障转移,取得主服务器上的相关资源的所有权,接替主服务器继续不间断的提供服务,从而达到资源以及服务高可用的目的。
heartbeat还支持主主模式,及两台服务器互为主备。一般故障切换时间在5~20s之间。
另外:和keepalived的服务一样,heartbeat高可用是服务器级别的,不是服务级别的。
- 服务器宕机
- heartbeat软件故障
- 心跳连接线故障)
服务故障不会导致切换,可以通过服务宕机把heartbeat服务停掉。
心跳连接:
至少需要两台主机才可以实现高可用服务。
两台heartbeat服务之间通信:
- 穿行电缆,所谓的串口(首先,缺点是距离不能太远)
- 一根以太网电缆两网卡直连(常用方式)
- 以太网电缆,通过交换机等网络设备连接。(交换机可能出现问题等)
Heartbeat裂脑(splitbrain)
两台服务器在一定时间内,无法相互检测到对方心跳而各自启动故障转移功能,取得资源和服务的所有权,会导致同一个IP在两端同时启动服务,存在两个相同的VIP,造成冲突的严重问题。
- 裂脑的原因:
- 心跳链路故障,导致无法正常通信
- 开启了防火墙阻挡了心跳信息传输
- 心跳网卡地址等配置不正确
- 心跳方式,心跳广播冲突,软件bug
- 防止裂脑方案:
- 同时使用串行电缆和以太网电缆连接,同时使用两条心跳线
- 检测到裂脑时,强制关闭一个节点。(需要特殊设备支持,如stonish和fence)。相当于程序上的备节点发现心跳故障,发送关机指令到主节点。
- 做好监控预警
- 启用磁盘锁
- 仲裁机制(确定让那个节点接管服务)
- fence设备介绍
- IBM:RSA
- HP:ILO
- DELL:iDRAC
- 外部设备有APC生产的PowerSwitch
消息类型:
- 心跳消息(单播,广播或者多播):150字节的数据包
- 集群转换消息:ip-request,ip-request-rsp
- 重传消息:rexmit-request
IP地址接管和故障转移:
heartbeat通过ip地址接管和arp广播进行故障转移的。
ARP广播:在主服务器故障时,备用节点接管资源后,会立即强制更新所有客户端本地的arp表(即清楚客户端本地缓存的故障服务器的vip和mac地址的解析记录),确保客户端和新的主服务器的对话。
真是IP,又被称为管理ip,一般指配置在物理网卡上面的ip。在负载均衡高可用环境中,管理IP是不对外提供访问服务的。仅仅作为管理服务器使用,如SSH可以通过这个进行服务连接管理。
VIP是虚拟ip,实际上就是eth0:X,x为0~255的任意数字,你可以在一个网卡上面绑定多个别名。VIP当主服务器故障时,可以自动漂移到备用服务器。
注意区别辅助ip和别名ip,keepalived和heartbeat3都是用辅助ip的形式。
辅助ip设置:ip addr add 192.168.12.1 dev eth1
ip addr del 192.168.12.1 dev eth1
别名ip设置:ifconfig eth0 192.168.12.1
ifconfig eth0 down
heartbeat配置文件:
默认配置文件目录/etc/ha.d/,常用配置文件:
配置名称 | 作用 | 备注 |
ha.cf | 参数配置文件 | 配置基本参数 |
authkey | 认证文件 | |
haresource | 资源配置文件 | 启动ip脚本程序配置文件 |
实际案例:
- 修改主机名分别为ha1和ha2,分别加入host文件中:
关闭iptables和selinux:
时间同步:
主机名 | ip地址 |
ha1 | 192.168.227.213 |
ha2 | 192.168.227.213 |
VIP=192.168.227.120
配置添加主机路由:
- 安装heartbeat3软件
安装epel源:
yum安装heartbeat3:
查看heartbeat安装软件的路径:主要在/etc/ha.d下和
拷贝三大配置文件到/etc/ha.d目录下:
- authkeys配置文件
选择对应的1,2,3选项,去除前面的#即可。
文件权限600。chmod 600 authkeys
- ha.cf文件较为详细,不做介绍。
其中ucast为单播方式IP地址分别为对方的ip地址
- haresource
主节点名 VIP地址 服务名
此文件主备节点配置相同。
- 分别在两台服务器上安装httpd服务并启动
故障测试:
两台节点服务器同时开启heartbeat服务和httpd服务
因为heartbeat高可用是服务器级别的,所以停止一台服务器的heartbeat服务,发现备用节点启用,并且启用相关的httpd服务,代表高可用成功。