Linux高性能集群常用服务简介与配置(三)——Heartbeat
2011-01-09 11:10 onm 阅读(281) 评论(0) 编辑 收藏 举报简介
Heartbeat 项目是 Linux-HA 工程的一个组成部分,它实现了一个高可用集群系统。心跳服务和集群通信是高可用集群的两个关键组件,在 Heartbeat 项目里,由 heartbeat 模块实现了这两个功能。下面描述了 heartbeat 模块的可靠消息通信机制,并对其实现原理做了一些介绍。
1.对于特定服务(如web服务)配置主服务器和备份服务器
2.主服务器运行特定服务,备份服务器上配置Heartbeat监听主服务器的“心跳”
3.若备份服务器未能监听到主服务器的“心跳”,则启动故障转移,在备份服务器上启动特定服务。
在高可用系统中,心跳消息应该通过多个独立的通信路径进行传送,从而消除通信路径单点故障。心跳消息可以同时通过一个或多个物理连接发送,备份服务器只要从这些物理连接中的任意一个收到主服务器的心跳,即认为主服务器正常工作。
三种最基本的心跳控制消息
1.心跳或状态消息
主服务器周期性向备份服务器发送的消息,表征主服务器的状态(live/dead),通常约150字节,通过广播,单播或多播方式传送。
2.机群转换消息
主要包括ip-request和ip-request-resp
Ip-request: 主服务器故障修复时,主服务器发送ip-request消息,通知从服务器关闭接管的服务。
Ip-request-resp:备份服务器接收到ip-request消息,关闭接管服务后,返回给主服务器的响应消息。
3.重传请求
备份服务器接收到的心跳消息超出了序列的范围时发出该消息,要求心跳消息重传。
配置
Heartbeat所需的rpm安装包
- Heartbeat-*
- Heartbeat-stonith-*
- Heartbeat-pils-*
使用rpm –ivh命令安装,使用rpm –qa 命令查看
三个主要配置文件
- /etc/ha.d/ha.cf:
- 指定各个系统上的heartbeat进程之间如何通信
- /etc/ha.d/haresources
- 指定节点具有的服务
- /etc/ha.d/authkeys
- 指定heartbeat数据包如何加密
1.配置/etc/ha.d/ha.cf
1)通过如下命令,找到heartbeat rpm包中样本配置文件ha.cf
#rpm –qd heartbeat | grep ha.cf
2)将样本配置文件复制到指定位置
#cp /usr/share/doc/heartbeat-2.0.8/ha.cf /etc/ha.d
3)编辑ha.cf文件
-
- 1〉使能选项
Keepalive : 指定两个心跳信号之间需要间隔多少分钟
Deadtime:指定在未收到主服务器的heartbeat多久后可以确认主服务器失效。
Initdead:指定在heartbeat进程首次运行后,需要等待多少秒钟后才能启动主服务器上的服务
* Deadtime和keepalive的时间不能过于接近,通常deadtime需要是keepalive的两倍以上
-
- 2〉心跳物理路径设置
注释掉配置行: #udpport 694
选择物理路径设置
-
- 3〉添加配置项
node 主服务器名 备份服务器名
2.配置haresources文件
1)通过如下命令,找到heartbeat rpm包中样本配置文件haresources
#rpm –qd heartbeat | grep haresources
2) 将样本配置文件复制到指定位置
#cp /usr/share/doc/heartbeat-2.0.8/haresources /etc/ha.d
3)编辑haresources文件
在文件尾部添加如下信息:
主服务器名 ip别名 工作服务名
3.配置/etc/ha.d/authkeys文件
1)通过如下命令,找到heartbeat rpm包中样本配置文件ha.cf
#rpm –qd heartbeat | grep authkeys
2)将样本配置文件复制到指定位置
#cp /usr/share/doc/heartbeat-2.0.8/authkeys /etc/ha.d
3)编辑配置文件
在文件中,注释掉其他配置行,仅保留如下两行:
auth 1
1 sha1 <password>
4)修改文件属性
#chmod 600 /etc/ha.d/authkeys
4.在备份服务器上,安装heartbeat,并将所有配置文件复制到备份服务器上
#scp –r /etc/ha.d/ 备份服务器名:/etc/ha.d
5.设置系统时间
Heartbeat要求主服务器与备份服务器的时间差异应在几分钟内
可使用date命令设置服务期时间
启动命令
#/etc/init.d/heartbeat start
通过系统日志检查heartbeat服务状态
#tail –f /var/log/messages
测试
vC0-168-129-128开启heartbeat后ip信息截图。
访问192.168.200.4浏览器截图。
停止vC0-168-129-128的heartbeat服务。
停掉vC0-168-129-128的heartbeat服务后,vC0-168-129-129接管192.168.200.4这个ip。
重新访问192.168.200.4,浏览器显示的网页为从vC0-168-129-129服务器返回,上方出现qqq。
。