Centos7.5-rsync-inotify-VS-rsync--seysync实时同步配置
一、rsync+inotify-tools与rsync+sersync架构解析
####用rsync+sersync架构原因?
1、sersync是基于inotify开发的,类似于inotify-tools的工具
2、sersync可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或者某一个目录的名字,然后使用rsync同步的时候,只同步发生变化的文件或者目录
####rsync+inotify-tools与rsync+sersync架构的区别?
1、rsync+inotify-tools
a、inotify只能记录下被监听的目录发生了变化(增,删,改)并没有把具体是哪个文件或者哪个目录发生了变化记录下来;
b、rsync在同步的时候,并不知道具体是哪个文件或目录发生了变化,每次都是对整个目录进行同步,当数据量很大时,整个目录同步非常耗时(rsync要对整个目录遍历查找对比文件),因此效率很低
2、rsync+sersync
a、sersync可以记录被监听目录中发生变化的(增,删,改)具体某个文件或目录的名字;
b、rsync在同步时,只同步发生变化的文件或目录(每次发生变化的数据相对整个同步目录数据来说很小,rsync在遍历查找对比文件时,速度很快),因此效率很高。
同步过程:
1. 在同步服务器上开启sersync服务,sersync负责监控配置路径中的文件系统事件变化;
2. 调用rsync命令把更新的文件同步到目标服务器;
3. 需要在主服务器配置sersync,在同步目标服务器配置rsync server(注意:是rsync服务)
同步过程和原理:
1. 用户实时的往sersync服务器上写入更新文件数据;
2. 此时需要在同步主服务器上配置sersync服务;
3. 在另一台服务器开启rsync守护进程服务,以同步拉取来自sersync服务器上的数据;
通过rsync的守护进程服务后可以发现,实际上sersync就是监控本地的数据写入或更新事件;然后,在调用rsync客户端的命令,将写入或更新事件对应的文件通过rsync推送到目标服务器
本次配置参考服务器为:源服务器A 192.168.100.150 备份同步服务器B 192.168.100.151 均匀设置免密登陆用户均为root
服务器A 免密通过ssh的秘钥对方式认证登陆 服务器B,免密配置参考如下:
.ssh的密钥对方式验证登录:
a.密钥对必须在客户端上生成,拷贝公钥到服务端对应的目录下。注:客户端用户必须要有私钥,服务端用户必须要有公钥;
b.服务器A-150配置如下命令:
ssh-keygen -t rsa ##客户端创建密钥对,一路回车,密钥对存放在~/.ssh目录中,id_rsa为私钥、 id_rsa.pub为公钥;
ssh-copy-id root@192.168.100.151 ##上传公钥到目标主机中,切导入到目标主机的用户家目录中,~/.ssh/authorized_keys文件中,如若上传失败,使用scp进行拷贝并导入: scp .ssh/id_rsa.pub 用户@目标主机ip地址;
ssh root@192.168.100.151 ##验证不需要密码可直接进行登陆
注:同一台客户端实现无密码登陆服务器的多个用户时,只需将公钥上传至服务端的多个用户的家目录下即可;
分别在服务器A和服务器B的terminal执行:yum
install
rsync -y
二、Rsync本地、远程同步
1.rsync的角色:
发起端:使用rsync的主机就是发起端;
备份源:响应发起端的主机就是备份源;
2.rsync同步方向:
上行同步:上传,数据在发起端,备份源提供目录,远程用户必须对备份源目录拥有写入权限,发起端登陆的用户必须要对数据拥有读取权限;
下行同步:下载,数据在备份源上,发起端提供目录,发起端登陆的用户必须对目录拥有写入权限,远程用户必须对备份源的数据有读取权限;
3.语法:rsync 选项 原始位置 目标位置
常用选项:-a 归档模式、保留文件权限、时间、链接、归属、特殊文件
-v 输出详细信息
-z 压缩传输
-H 保持硬链接
-r 递归模式,递归子文件及子文件夹
--delete 删除目标目录有,原始位置没有的文件
常用选项组合:-av -avzH --delete
4.本地同步复制文件语法:rsync -av /源文件 /目标目录/
注:当源文件为例/tmp时,那么将复制tmp整个目录及目录下的文件;
当源文件为例/tmp/时,那么将复制tmp目录下的所有文件,不包含tmp目录本身;
可同时复制多个文件,中间用空格隔开;
示例:
rsync -av /etc /data #同步etc下所有文件到 /data目录下(包括etc目录本身)
rsync -av /etc/ /data #同步etc下所有文件到 /data目录下(不包括etc目录本身)
5.清空本地目录语法:rsync -av --delete /空目录/ /目标目录/
注:删除目标目录有,空目录中没有的目标目录中的文件,空目录可以自己创建,则此就达到了删除的目的;
6.远程同步复制文件语法:
上行同步(上传):rsync -avzH 本地数据 用户@备份源ip地址:备份目录
示例:rsync -avzH /etc root@192.168.100.151:/data/ ## #root用户免密登陆92.168.100.151服务器B同时同步当前etc下所有文件到 /data目录下(包括etc目录本身)
示例:如果有端口 rsync -e 'ssh -p 2222' -avzH /etc root@192.168.100.151:/data/ ###root用户通过端口2222免密登陆92.168.100.151服务器B同时同步当前etc下所有文件到 /data目录下(包括etc目录本身)
下行同步(下载):rsync -avzH 用户@备份源ip地址:备份目录 本地备份目录
示例:rsync -avzH root@192.168.100.151:/data/ /etc/ ## #root用户免密登陆92.168.100.151服务器B同时/data目录下所有文件到 本机/etc目录下
三、Rsync+inotify实时同步
Rsync仅是一个文件复制工具,它无法对源端文件的增删改操作进行监听。在源端做出更改后,需要执行rsync命令才能将变更同步到目标端。
Rsync在每次同步前需要扫描整个目录。如果源目录内的文件数量比较多,扫描可能需要耗费较多的时间。
为了满足实时监听的要求,我们需要引入另一个工具:inotify。
文件系统事件监听工具inotify
inotify-tools为inotify提供一个简单接口。它是一个c语言编写的库,同时也包含命令行工具。
inotify-tools的详细介绍请点击: https://github.com/rvoicilas/inotify-tools/wiki
inotify-tools的安装
对于centos7系统,依次执行:
1
2
|
yum install -y epel-release yum --enablerepo=epel install inotify-tools |
使用inotifywait命令进行事件监听
1.inotify作用:内核模块,监控文件和目录的变化,通过inotify-tools工具提供inotify-wait(持续监控)和inotify-watch(短期监控)两个模块进行监控;
2.优化内核参数:
max_queued_events ##最大的时间列队
max_user_instances ##最大的实例
max_user_watchs ##最大的监控文件数量
注:实时同步是基于监控文件的,所以需要在文件所在端,并且rsync只能在发起端发出;
总结:实时同步只能处理上行,不能实现下行;
3.inotify+rsync实时同步案例:上行同步
a.安装inotify-tools;发起端192.168.100.150
tar zxvf inotify-tools-*.tar.gz -C /usr/src/
cd /usr/src/inotify-tools-*/
./configure &&make &&make install
ls /usr/local/bin/inotify*
b.inotify的使用:发起端192.168.100.150
vi /etc/sysctl.conf
fs.inotify.max_queued_events = 16384 ##监控事件队列数
fs.inotify.max_user_instances = 1024 ##监控实例数
fs.inotify.max_user_watches = 1048576 ##监控的文件数量
:wq
sysctl -p
c.测试inotify命令;发起端192.168.100.150
mkdir /root/data
inotifywait -mrq -e modify,create,attrib,move,delete /root/data
选项注解:-m持续监控,r递归目录,q简化输出,-e指定监控事件:modify修改、create创建、attrib权限修改、move移动、delete删除;在其他终端操作文件,查看变化
参数解析
- -m 保持持续监听状态,如果不写该参数,inotifywait会在监听到一次事件之后退出。
- -r 递归方式监听目录。
- -q 安静模式,打印输出较少的内容。
- --timefmt 指定时间的输出格式。
- --format 指定事件输出的格式。
- -e 设置监听的事件类型。这里监听增删改和metadata的变更。
d.编写监听脚本1如下(inotifywait-rsync.sh):
1
2
3
4
5
6
|
inotifywait -mrq --timefmt '%d/%m/%y %H:%M' -- format '%T %w%f' -e modify,delete,create,attrib /root/data/rsync/ | while read file do rsync -avPz --progress /root/data/rsync/ root@192.168.100.151:/root/data/rsync/ rsync -avPz --delete /root/data/rsync/ root@192.168.100.151:/root/data/rsync/ echo "${file} was synchronized" done |
编写脚本2:发起端192.168.100.150
vim rsync_inotify.sh ##实时同步脚本
#!/bin/bash
RSYNC="rsync -avzH /root/data/ root@192.168.100.151:/tmp/ --delete"
INT_CMD="inotifywait -mrq -e modify,create,move,delete,attrib /root/data/"
$INT_CMD |while read DIRECOTRY EVENT FILE;do
$RSYNC
done
:wq
chmod +x rsync_inotify.sh
./rsync_inotify.sh & ##启动脚本后台运行
对于每次触发的监听时间,inotifywait会执行do和done之间的代码。在这里,我们调用之前所说的rsync命令进行文件同步。
e.监听脚本加入crontab
1
2
|
crontab -e * * * * * sh /root/data/ inotifywait-rsync .sh |
f.测试验证,发起端创建测试文件。发起端192.168.100.150
cd /root/data
touch 1.txt
g.备份源验证文件是否同步;备份端192.168.100.151
ls /tmp/
在服务器A运行下面命令详解:
1
2
3
4
|
# (1) rsync -avPz --progress /root/data/rsync/ root@192.168.100.151:/root/data/rsync/ # (2) rsync -avPz --delete --progress /root/data/rsync/ root@192.168.100.151:/root/data/rsync/ |
会发现在demo.txt也出现在了服务器B中/root/data/rsync/目录。
上面两条命令解析:
(1) 将服务器A中的/root/data/rsync目录内的文件复制到服务器B(192.168.100.151)的/root/data/rsync中。
(2) 比较目标端和源端的文件,如果目标端的文件在源端不存在,在目标端删除该文件。
四、Rsync+sersync实时同步
sersync介绍
sersync主要用于服务器同步,web镜像等功能。基于boost1.43.0,inotify api,rsync command.开发。目前使用的比较多的同步解决方案是inotify-tools+rsync ,另外一个是google开源项目Openduckbill(依赖于inotify- tools),这两个都是基于脚本语言编写的。相比较上面两个项目,本项目优点是:
- sersync是使用c++编写,而且对linux系统文件系统产生的临时文件和重复的文件操作进行过滤(详细见附录,这个过滤脚本程序没有实现),所以在结合rsync同步的时候,节省了运行时耗和网络资源。因此更快。
- 相比较上面两个项目,sersync配置起来很简单,其中bin目录下已经有基本上静态编译的2进制文件,配合bin目录下的xml配置文件直接使用即可。
- 另外本项目相比较其他脚本开源项目,使用多线程进行同步,尤其在同步较大文件时,能够保证多个服务器实时保持同步状态。
- 本项目有出错处理机制,通过失败队列对出错的文件重新同步,如果仍旧失败,则按设定时长对同步失败的文件重新同步。
- 本项目自带crontab功能,只需在xml配置文件中开启,即可按您的要求,隔一段时间整体同步一次。无需再额外配置crontab功能。
- 本项目socket与http插件扩展,满足您二次开发的需要。
下载sersync
压缩包里面有两个文件confxml.xml sersync2
sersync2 这个是sersync主程序
confxml.xml 这个是sersync配置文件
安装sersync # tar -xzvf sersync2.5.4_64bit_binary_stable_final.tar.gz -C /usr/local/sersync
一个简单的演示示例:
确认当前系统关闭selinux及防火墙,或将873端口加入iptables白名单
我这里有两台centos7.5的主机,IP分别是192.168.100.150和192.168.100.151
我在192.168.100.150安装sersync,主动推送数据到192.168.100.151上
192.168.100.150配置,安装创建rsync配置文件
150源机器安装 :yum -y install xinetd rsync
151目标机器安装 :yum -y install rsync
编辑rsync配置文件
vi /etc/rsyncd.conf
uid=root
gid=root
address=192.168.100.150 #写自己的ip
port=873
hosts allow= * 或者 192.168.100.0/24
use chroot=yes
max connections=5
pid file=/var/run/rsyncd.pid
lock file=/var/run/rsync.lock
log file=/var/log/rsyncd.log
[wwwroot]
path=/root/data/
comment=used for web-data root
read only=false
list=yes
auth users=rsyncuser #不是系统用户,虚拟用户,不需要提前创建 只是用来同步数据
secrets file =/etc/rsync.passwd
注意注意 参数后面的空格最好都去掉
解释
uid=root
gid=root
address=192.168.1.145 #监听IP
port=873 #监听端口
hosts allow=192.168.0.0/24 #允许同步客户端的IP地址,或者用*表示所有 192.168.1.0/24或192.168.1.0/255.255.255.0
use chroot = yes #是否囚牢,锁定家目录,
max connections =5 #最大连接数
pid file =/var/run/rsyncd.pid #进程PID,自动生成
lock file =/var/run/rsync.lock #指max connectios参数的锁文件
log file =/var/log/rsyncd.log #日志文件位置
[wwwroot] #共享模块名称
path =/root/data/ #路径
comment = used for web-data root #描述
read only = false #设置服务端文件读写权限
list = yes #是否允许查看模块信息
auth users = rsyncuser #备份的用户,虚拟用户,和系统用户无关
secrets file =/etc/rsync.passwd #存放用户的密码文件,格式是 用户名:密码
exclude = .svn/ .git/ - runtime/ #不同步的文件
dont compress #用来指定那些不进行压缩处理再传输的文件,默认值是 *.gz *.tgz *.zip *.z *.rpm *.deb *.iso *.bz2 *.tbz
因为这些文件已经经过压缩咯,默认不用修改。
编辑密码: vim /etc/rsync.passwd
rsyncuser:123456 (这个用户是虚拟用户,不是系统用户,只是用来同步数据)
给权限 chmod 600 /etc/rsync.passwd
启动服务测试
启动rsync与xinetd服务
[root@150 ~]# systemctl start xinetd #启动xinetd服务
[root@150 ~]# systemctl enable xinetd #将xinetd服务加入开机项
[root@150~]# rsync --daemon --config=/etc/rsyncd.conf #加载配置文件rsyncd.conf启动rsync服务
[root@150 ~]# netstat -antup | grep :873
tcp 0 0:::873 :::* LISTEN 45089/xinetd
rsync语法: rsync 选项 用户名@备份源服务器IP::共享模块名 目标目录
常用的命令 –avz --exclude=filname,需要过滤的文件
-a, --archive archive mode 权限保存模式,相当于 -rlptgoD 参数,存档,递归,保持属性等
-z, --compress 压缩模式, 当资料在传送到目的端进行档案压缩.
--delete, 删除那些目标位置有的文件而备份源没有的文件
--password-file=FILE ,从 FILE 中得到密码
[root@151 ~]# rsync -avz /www/ rsyncuser@192.168.1.150::wwwroot
可以用这个先试一试 输入密码看是否能同步
有时候不同步,看看防火墙 在服务器上部署的时候防火墙是开的,需要添加873端口白名单需要在备份机上添加这是150
rsync -avz /www/ --exclude "runtime*" rsyncuser@192.168.1.150::wwwroot 不同步的也可以在这加
目标主机151同步测试
[root@151 ~]# vim /etc/rsync.passwd
123456
[root@151 ~]# chmod 600 /etc/rsync.passwd
[root@151 ~]#rsync -avz --delete /www/ rsyncuser@192.168.1.150::wwwroot --password-file=/etc/rsync.passwd
这样做个定时就可以实现定时备份了
[root@151 ~]# vim autobackup.sh
#!/bin/bash
rsync -avz /www/ rsyncuser@192.168.1.150::wwwroot --password-file=/etc/rsync.passwd
[root@151 ~]# chmod +x autobackup.sh
[root@151~]# sh autobackup.sh
添加到定时任务
01 3 * * * sh /root/autobackup.sh
至此 定时 实现定时备份了就可以了
配置sersync
启动sersync
在/root/data下创建、删除、修改文件都会实时同步到192.168.100.151服务器上
演示rsyncd+sersync 实时同步
1、下载sersync 在150上安装下面操作都是在150上 ( 从150上往151上同步 所以在150安装)
在google code下载sersync的可执行文件版本,里面有配置文件与可执行文件
wget https://sersync.googlecode.com/files/sersync2.5.4_64bit_binary_stable_final.tar.gz(有时下载失败,所有要本地留存才行)这是我上传的zip的解压了一样的下载地址
上传到服务器
cd /usr/local/ 目录下
tar xvf sersync2.5.4_64bit_binary_stable_final.tar.gz 解压后他的文件名是 GNU-Linux-x86
mv GNU-Linux-x86 sersync 名字改成serync 里面机两个文件一个是二进制文件 一个是配置文件
2、配置sersync
修改24--28行
<sersync>
<localpath watch="/root/data/"> #本地同步目录
<remote ip="192.168.1.151" name="wwwroot"/> #rsync模块名称
修改31--34行,认证部分【rsync密码认证】
<rsync>
<commonParams params="-artuz"/>
<auth start="true" users="rsyncuser" passwordfile="/etc/rsync.passwd"/>
<userDefinedPort start="false" port="874"/><!-- port=874 -->
<timeout start="false" time="100"/><!-- timeout=100 -->
<ssh start="false"/>
注:红色的修改的内容
保存退出
3、配置sersync开启sersync守护进程同步数据
/usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/confxml.xml
测试 在150上添加文件 看151上有没有变化 可动态查看 watch ls -l
4、设置sersync监控开机自动执行
vim /etc/rc.d/rc.local #编辑,在最后添加一行
/usr/local/sersync/sersync2 -d -r -o /usr/local/sersync/confxml.xml #设置开机自动运行脚本
5、添加脚本监控sersync是否正常运行
vi /usr/local/sersync/check_sersync.sh #编辑,添加以下代码
#!/bin/sh
sersync="/usr/local/sersync/sersync2"
confxml="/usr/local/sersync/confxml.xml"
status=$(ps aux |grep 'sersync2'|grep -v 'grep'|wc -l)
if [ $status -eq 0 ];
then
$sersync -d -r -o $confxml &
else
exit 0;
fi
chmod +x /usr/local/sersync/check_sersync.sh #添加脚本执行权限
把这个脚本加到任务计划,定期执行检测
6、补充: 多实例情况
1、配置多个confxml.xml文件(比如:www、bbs、blog....等等)
2、根据不同的需求同步对应的实例文件
/usr/local/sersync/sersync2 -d -o /usr/local/sersync/www_confxml.xml
/usr/local/sersync/sersync2 -d -o /usr/local/sersync/bbs_confxml.xml
修改配置之后需要重启
systemctl restart xinetd 重启 xinetd
systemctl restart rsyncd 重启 rsyncd
///////////************筛选 rsync 的传输目标*****************************/
筛选 rsync 的传输目标
使用 --exclude/--include 选项
可以使用 ––exclude 选项排除源目录中要传输的文件;同样地,也可以使用 ––include 选项指定要传输的文件。
例如:下面的 rsync 命令将 192.168.100.151 主机上的 /www 目录(不包含 /www/logs 和 /www/conf子目录)复制到本地的 /backup/www/ 。
# rsync -vzrtopg --delete --exclude "logs/" --exclude "conf/" --progress backup@192.168.100.151:/www/ /backup/www/
又如:下面的 rsync 命令仅复制目录结构而忽略掉目录中的文件。
# rsync -av --include '*/' --exclude '*' \
backup@1192.168.100.151:/www/ /backup/www-tree/
选项 ––include 和 ––exclude 都不能使用间隔符。例如:
--exclude "logs/" --exclude "conf/"
不能写成 --exclude "logs/ conf/"
使用 --exclude-from/--include-from 选项
当 include/exclude 的规则较复杂时,可以将规则写入规则文件。使用规则文件可以灵活地选择传输哪些文件(include)以及忽略哪些文件(exclude)。
若文件/目录在剔除列表中,则忽略传输
若文件/目录在包含列表中,则传输之
若文件/目录未被提及,也传输之
在 rsync 的命令行中使用 ––exclude-from=FILE 或 ––include-from=FILE 读取规则文件。
规则文件 FILE 的书写约定:
每行书写一条规则 RULE
以 # 或 ; 开始的行为注释行
包含(include)和排除(exclude)规则的语法如下:
include PATTERN 或简写为 + PATTERN
exclude PATTERN 或简写为 - PATTERN
PATTERN 的书写规则如下:
以 / 开头:匹配被传输的根路径上的文件或目录
以 / 结尾:匹配目录而非普通文件、链接文件或设备文件
使用通配符
*:匹配非空目录或文件(遇到 / 截止)
**:匹配任何路径(包含 / )
?:匹配除了 / 的任意单个字符
[:匹配字符集中的任意一个字符,如 [a-z] 或 [[:alpha:]]
可以使用转义字符 \ 将上述通配符还原为字符本身含义
下面给出几个使用规则的例子:
例1:
# 不传输所有后缀为 .o 的文件
- *.o
# 不传输传输根目录下名为 foo 的文件或目录
- /foo
# 不传输名为 foo 的目录
- foo/
# 不传输 /foo 目录下的名为 bar 的文件或目录
- /foo/bar
例2:
# 传输所有目录和C语言源文件并禁止传输其他文件
+ */
+ *.c
- *
例3:
# 仅传输 foo 目录和其下的 bar.c 文件
+ foo/
+ foo/bar.c
- *
将规则写入规则文件之后,如何在命令行上使用它呢?下面给出一个例子:
首先将下面的规则存入名为 www-rsync-rules 的文件
# 不传输 logs 目录
- logs/
# 不传输后缀为 .tmp 的文件
- *.tmp
# 传输 Apache 虚拟主机文档目录(/*/ 匹配域名)
+ /srv/www/
+ /srv/www/*/
+ /srv/www/*/htdocs/
+ /srv/www/*/htdocs/**
# 传输每个用户的 public_html 目录(/*/ 匹配用户名)
+ /home/
+ /home/*/
+ /home/*/public_html/
+ /home/*/public_html/**
# 禁止传输其他
- *
然后即可使用类似如下的 rsync 命令:
rsync -av --delete --exclude-from=www-rsync-rules / remotehost:/dest/dir
/***************************************************/