Loading

22、部署drdb


22.1、heartbeat部署规划:

本文的实验环境是虚拟机设备;


名称

接口

ip

用途

master-db(主)

eth0

10.0.0.16/24

用于服务器之间的数据同步(直连)

eth1

172.16.1.16/24

管理ip用于数据转发

vip

172.16.1.26/24

提供对外访问的ip

slave-db(从)

eth0

10.0.0.17/24

用于服务器之间的数据同步(直连)

eth1

172.16.1.17/24

管理ip用于数据转发

vip

172.16.1.26/24

提供对外的访问的ip





22.2、在关机状态下分别为master-db和slave-db添加20G的硬盘:

22.3、关闭selinux和防火墙:

master-db和slave-db的操作相同;

1、关闭selinux:

sed -i 's#SELINUX=enforcing#SELINUX=disabled#g' /etc/selinux/config

grep "SELINUX=disabled" /etc/selinux/config

setenforce 0

2、关闭防火墙:

/etc/init.d/iptables stop

chkconfig iptables off

22.4、修改主机名:

1、master-db:

[root@master-db ~]#sed -i "s#HOSTNAME=.*#HOSTNAME=master-db#g" /etc/sysconfig/network

[root@master-db ~]#hostname master-db

[root@master-db ~]#hostname

master-db

2、slave-db:

[root@slave-db ~]#sed -i "s#HOSTNAME=.*#HOSTNAME=slave-db#g" /etc/sysconfig/network

[root@slave-db ~]#hostname slave-db

[root@slave-db ~]#hostname

slave-db

22.5、配置master-db和slave-db之间的直连心跳线路由:

主从之间的关系全靠心跳线进行联系;

1、master-db:

[root@master-db ~]#route add -host 10.0.0.17 dev eth0

[root@master-db ~]#route -n

Kernel IP routing table

Destination Gateway Genmask Flags Metric Ref Use Iface

10.0.0.17 0.0.0.0 255.255.255.255 UH 0 0 0 eth0

[root@master-db ~]#echo '/sbin/route add -host 10.0.0.17 dev eth0' >>/etc/rc.local

2、slave-db:

[root@slave-db ~]#route add -host 10.0.0.16 dev eth0

[root@slave-db ~]#route -n

Kernel IP routing table

Destination Gateway Genmask Flags Metric Ref Use Iface

10.0.0.16 0.0.0.0 255.255.255.255 UH 0 0 0 eth0

[root@slave-db ~]#echo '/sbin/route add -host 10.0.0.16 dev eth0' >>/etc/rc.local

22.6、修改域名解析文件:

master-db和slave-db的操作相同;

vim /etc/hosts

10.0.0.16 master-db

10.0.0.17 slave-db

ping域名看是否可以ping通;

22.7、磁盘分区:

master-db和slave-db的操作相同;

parted /dev/sdb mklabel gpt

parted /dev/sdb mkpart primary 0 5G

parted /dev/sdb mkpart primary 5 6G

parted /dev/sdb p

Model: VMware, VMware Virtual S (scsi)

Disk /dev/sdb: 6442MB

Sector size (logical/physical): 512B/512B

Partition Table: gpt

Number Start End Size File system Name 标志

1 17.4kB 5000MB 5000MB primary

2 5000MB 6442MB 1442MB primary

22.8、drbd软件安装:

master-db和slave-db的操作相同;

1、下载rpm包:

mkdir -p /root/tools

cd /root/tools

wget http://mirror.rackspace.com/elrepo/elrepo/el6/x86_64/RPMS/drbd84-utils-8.9.8-1.el6.elrepo.x86_64.rpm

wget http://mirror.rackspace.com/elrepo/elrepo/el6/x86_64/RPMS/kmod-drbd84-8.4.9-1.el6.elrepo.x86_64.rpm

2、安装:

rpm -ivh drbd84-utils-8.9.8-1.el6.elrepo.x86_64.rpm

rpm -ivh kmod-drbd84-8.4.9-1.el6.elrepo.x86_64.rpm

22.9、加载内核:

master-db和slave-db的操作相同;

ls -ld /usr/src/kernels/$(uname -r)

drwxr-xr-x 22 root root 4096 10月 8 23:29 /usr/src/kernels/2.6.32-754.3.5.el6.x86_64

#如果报错需要的包安装如下的软件包;

#yum install -y kernel kernel-devel kernel-headers gcc flex libxslt

modprobe drbd #临时生效;

lsmod | grep drbd

drbd 374888 0

libcrc32c 1246 1 drbd

加入到开机自启动中:

echo '/sbin/modprobe drbd' >>/etc/rc.local

tail -1 /etc/rc.local

22.10、配置drbd配置文件:

master-db和slave-db的操作相同;

1、文件说明:

ls /etc/drbd.d/ #包含文件;

global_common.conf

ls /etc/drbd.conf #配置文件用于包含/etc/drbd.d/中的配置文件;

/etc/drbd.conf

2、配置global_common.conf文件:

cp /etc/drbd.d/global_common.conf{,.bak}

egrep -v "^$|#" /etc/drbd.d/global_common.conf

global { #全局配置

usage-count no;

#不允许开源网站统计开源软件的数量,默认是yes;

}

common {

protocol C;

#使用实时同步数据的方法;

disk {

on-io-error detach;

#同步IO错误的做法是分离该磁盘;

}

net {

cram-hmac-alg "sha1";

#设置加密算法;

shared-secret "mydrbd";

#设置加密随机key;

}

syncer {

rate 100M; #同步的速度;

}

}

resource data {

on master-db { #主机器的主机名;

device /dev/drbd0; #drbd设备;

disk /dev/sdb1; #本地的存储分区;

address 10.0.0.16:7788;

#监听的直连网线,即数据端口,7788是默认端口;

meta-disk /dev/sdb2[0]; #drbd状态数据分区;

}

on slave-db { #从机器的主机名;

device /dev/drbd0;

disk /dev/sdb1;

address 10.0.0.17:7788;

meta-disk /dev/sdb2[0];

}

}

提示:如果需要加磁盘只需要拷贝resource配置即可,然后更改资源名称、数据传输的ip地址和

端口号、drbd状态数据分区、本地的存储分区、drbd设备的名称;

22.11、激活drbd:

master-db和slave-db的操作相同;

1、初始化meta分区:

drbdadm create-md data #data是/etc/drbd.d/global_common.conf配置文件的resource名称;

initializing activity log

NOT initializing bitmap

Writing meta data...

New drbd meta data block successfully created.

提示:drbdadm -V :查看当前drbd的安装版本;

2、启动drbd服务:

drbdadm up data =》/etc/init.d/drbd start

Device '0' is configured!

Command 'drbdmeta 0 v08 /dev/sdb2 0 apply-al' terminated with exit code 20

#######################################################################

#表示启动data资源,可以用"all"代表启动所有资源;

#drbdadm up all

#相当于以下三个命令的组合:

#drbdadm attach all

#drbdadm syncer all

#drbdadm connect all

########################################################################

cat /proc/drbd #查看drbd的启动进程,没有设置主从时默认两边都是从;

version: 8.4.9-1 (api:1/proto:86-101)

GIT-hash: 9976da086367a2476503ef7f6b13d4567327a280 build by mockbuild@Build64R6, 2016-12-13 18:38:15

0: cs:Connected ro:Secondary/Secondary ds:Inconsistent/Inconsistent C r-----

ns:0 nr:0 dw:0 dr:0 al:8 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:263152

22.12、确定drbd的主从关系:

1、设置master-db为主:

[root@master-db ~]#drbdadm -- --overwrite-data-of-peer primary data

#第一次操作时使用;

#此操作很危险会把这边的数据推到对端并覆盖,如果对端有数据需要进行备份;

2、查看master-db的状态:

[root@master-db ~]#cat /proc/drbd

version: 8.4.9-1 (api:1/proto:86-101)

GIT-hash: 9976da086367a2476503ef7f6b13d4567327a280 build by mockbuild@Build64R6, 2016-12-13 18:38:15

0: cs:SyncSource ro:Primary/Secondary ds:UpToDate/Inconsistent C r-----

ns:346500 nr:0 dw:0 dr:349848 al:8 bm:0 lo:0 pe:1 ua:3 ap:0 ep:1 wo:f oos:4536684

[>...................] sync'ed: 7.3% (4428/4768)M

finish: 0:01:57 speed: 38,456 (38,456) K/sec

3、查看slave-db的状态:

[root@slave-db ~]#cat /proc/drbd

version: 8.4.9-1 (api:1/proto:86-101)

GIT-hash: 9976da086367a2476503ef7f6b13d4567327a280 build by mockbuild@Build64R6, 2016-12-13 18:38:15

0: cs:SyncTarget ro:Secondary/Primary ds:Inconsistent/UpToDate C r-----

ns:0 nr:346112 dw:346112 dr:0 al:8 bm:0 lo:1 pe:3 ua:0 ap:0 ep:1 wo:f oos:4536684

[>...................] sync'ed: 7.3% (4428/4768)M

finish: 0:01:57 speed: 38,456 (38,456) want: 102,400 K/sec

22.13、格式化磁盘:

如果之前主从在分区后就格式化磁盘了,这里就不需要格式化磁盘了;

只需要操作主节点master-db即可,从节点会跟随主节点进行格式化;

[root@master-db ~]#mkfs -t ext4 -b 4096 /dev/drbd0

[root@master-db ~]#tune2fs -c -1 /dev/drbd0 #禁止定期检查磁盘

tune2fs 1.41.12 (17-May-2010)

Setting maximal mount count to -1

22.14、挂载master-db磁盘:

特别注意:挂载的不是/dev/sdb1系统分区,挂载的是drbd的drbd0逻辑分区,通过挂载点写到drbd0逻辑分区上然后写到/dev/sdb1

系统分区上;不挂载slave-db的/dev/sdb1磁盘,因为该系统分区已经被/dev/drbd0设备占用,且不可见;

[root@master-db ~]#mkdir -p /master-db

[root@master-db ~]#mount /dev/drbd0 /master-db/

#说明:只有置为主端的时才可以这样挂载,否则要停掉资源后挂载本地的系统资源,如/dev/sdb1;

[root@master-db ~]#df -hT

Filesystem Type Size Used Avail Use% Mounted on

/dev/drbd0 ext4 4.5G 9.4M 4.3G 1% /master-db

22.15、测试:

1、master-db:

[root@master-db ~]#cd /master-db/

[root@master-db ~]#touch /master-db/{1..6}.txt

[root@master-db ~]#ls /master-db/

1.txt 2.txt 3.txt 4.txt 5.txt 6.txt lost+found

2、slave-db:

[root@slave-db ~]#drbdadm down data #停掉drbd服务;

[root@slave-db ~]#mkdir -p /slave-db #创建/dev/sdb1的挂载点;

[root@slave-db ~]#mount /dev/sdb1 /master-db/ #挂载;

[root@slave-db ~]#ls /slave-db/ #数据已经同步过来了;

1.txt 2.txt 3.txt 4.txt 5.txt 6.txt lost+found

提示:因为slave-db上的/dev/sdb1系统分区被'/dev/drbd0'设备占用,不能够查看数据,所以需要停止后挂载查看,但是这种访问方法是不规范的;

[root@slave-db ~]#df -hT #查看磁盘

Filesystem Type Size Used Avail Use% Mounted on

/dev/drbd0 ext4 4.5G 9.4M 4.3G 1% /master-db

[root@slave-db ~]#umount /dev/sdb1 #卸载分区;

[root@slave-db ~]#drbdadm up data #启动drbd服务;

3、查看master-db和slave-db的磁盘使用状态参数说明:

(1)master-db:

[root@master-db ~]#cat /proc/drbd

version: 8.4.9-1 (api:1/proto:86-101)

GIT-hash: 9976da086367a2476503ef7f6b13d4567327a280 build by mockbuild@Build64R6, 2016-12-13 18:38:15

0: cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r-----

ns:48 nr:0 dw:48 dr:1357 al:2 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0

(2)slave-db:

[root@slave-db ~]#cat /proc/drbd

cat /proc/drbd

version: 8.4.9-1 (api:1/proto:86-101)

GIT-hash: 9976da086367a2476503ef7f6b13d4567327a280 build by mockbuild@Build64R6, 2016-12-13 18:38:15

0: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate C r-----

ns:0 nr:48 dw:48 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0

4、小结:

(1)通过测试可以发现主从连接状态(cs)、角色(ro)、磁盘状态(ds)正常,且主的数据发送(ns)量和

从的数据接收(nr)、写入(dw)量相同,说明数据同步是成功的;

(2)drbd状态码解释:

1)0: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate C r-----

0 #drbd的次设备号(minor),表示该行是/dev/drbd0资源的信息;

cs #connect state,即节点的连接状态wf未初始化状态;

ro #roles,即节点的角色状态;

ds #disk state,即磁盘的状态,也即drbd底层设备的状态,UpToDate表示正常、inconsistent初始化之前同步的状态;

C #drbd的复制协议,即A、B、C协议;

r-----#是IO标记,反应的是该资源的IO状态信息。共有6种IO状态标记符号;

2)ns:0 nr:48 dw:48 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0

ns/send (network send) #通过网络连接发送给对端的数据量,单位为KB。

nr/receive (network receive) #通过网络连接接收到对端发送来的数据量,单位为KB。

dw/written (disk write) #写入本地磁盘的数据量,单位为KB。

dr/read (disk read) #从本地磁盘读取的数据量,单位为KB。

al/al-writes (activity log) #元数据区中al更新的次数。

bm/bm-writes (bit map) #元数据区中bitmap更新的次数。

lo/lower-pending (local count) #DRBD发起的打开本地IO子系统的请求次数。

pe/pending (pending) #本地发送给对端但却没有回复的次数。

ua/unacked (unacknowledged) #接收到对端发送的请求但却没有给予回复的请求数量。

ap/upper-pending (application pending) #转发给DRBD的IO块的请求,但DRBD还没给予回复的请求数量。

ep (epochs) #epoch对象的数量。通常为1。drbd9中没有该指标。

wo/write-ordering (write order) #当前正在使用的write order方法:b(barrier), f(flush), d(drain)或n(none)。

oos/out-of-sync (out of sync) #当前不同步的数据量,单位为KB。

22.16、总结:

1、drbd应用注意项:

(1)drbd开机默认是不自启动的;

chkconfig --list drbd

drbd 0:关闭 1:关闭 2:关闭 3:关闭 4:关闭 5:关闭 6:关闭

(2)在生产环境中drbd设置的是开机不自启的,人工管理;

(3)drbd停止主服务器端需要卸载(umount /dev/drbd0)设备,然后(/etc/init.d/drbd stop)

停止服务即可,从服务端可以直接停掉;

(4)主从都停止再启动,两边都是从状态(/proc/drbd)也会被清空,说明drbd有自我保护的功能;如果停止的是从

端,从端再启动后,能够确定主从关系,从的状态数据会重新开始;如果停止的是主,主再起就会变成从;

drbd的C模式保证了两边数据的一致性;主端挂载,从端隐藏;

重新确定主端的命令是:drbdadm primary data;

重新确定从端的命令是:drbdadm secondary data;

(5)使用'drbdadm -- --overwrite-data-of-peer primary data'命令指定主端时会将主端的

数据推到主端,覆盖掉,所以需要谨慎操作,如果从端有数据需要进行备份(该参数只用一次,在

初始安装drbd的时候);

2、DRBD报错:0: Failure: (119) No valid meta-data signature found:

(1)原因:

使用fdisk分区时有问题;

(2)解决办法:

分区后'/dev/sdb2'分区不要格式化;如果执行'partprobe'命令报错,需要重启服务器,然后

重新初始化(drbdadm create-md data)数据后再启动(drbdadm up data);

3、查看drbd状态时出现secondary/Uknow的解决的方法:

(1)检查两台drbd服务器物理网络或者连接ip及主机直连路由是否正确;

route add -host '对端ip' dev eth0

(2)停止防火墙,或者放行drbd同步;

(3)还有可能发生裂脑了(官方推荐方法);

1)在从节点slave-db上做如下的操作:

drbdadm secondary data

drbdadm disconnect data

drbdadm -- --discard-my-data connect data

#是个断开连接的过程;

2)在主节点master-db上做如下的操:

通过cat /etc/proc/drbd查看状态,如果是WFConnection状态,需要手动进行连接;

drbdadm connect data

3)查看主从两端的状态:

cat /etc/proc/drbd

3、master-db的磁盘可见,slave-db的磁盘不可见;

实时的差异同步;
















posted @ 2020-02-16 10:51  云起时。  阅读(413)  评论(0编辑  收藏  举报