rsync+inotify实现文件实时同步
一、相关组件简介
1、rsync
与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据 时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的 一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定 会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!
2、inotify
Inotify 是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统 中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样 的一个第三方软件。
在上面章节中,我们讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。
查看内核是否支持inotify API,如果有以下三项,表示系统已经默认支持inotify:
ll /proc/sys/fs/inotify
二、软件安装和配置
安装Rsync
分别在服务器A和服务器B的terminal执行:
sudo yum install rsync
安装完毕后,会发现rsync的配置文件位于 etc/rsyncd.conf 。该文件使用daemon方式同步时需要使用,此处暂不介绍。
配置服务器A和B之间的免密登录
服务器A执行:
ssh-keygen ssh-copy-id 服务器B的IP地址
inotify-tools的安装
yum install -y epel-release yum --enablerepo=epel install inotify-tools
使用inotifywait命令进行事件监听
监听脚本如下(inotifywait-rsync.sh):
host=192.168.171.129 src1=/home/esoon/rsync/ src2=/home/esoon/test/ /usr/bin/inotifywait -mrq --timefmt '%d/%m/%y %H:%M' --format '%T %w%f' -e modify,delete,create,attrib $src1 $src2 | while read file do rsync -avPz --delete --progress $src1 $host:$src1 rsync -avPz --delete --progress $src2 $host:$src2 echo "${file} was rsynced" >>rsync.log 2>&1 done
参数解析
- -m 保持持续监听状态,如果不写该参数,inotifywait会在监听到一次事件之后退出。
- -r 递归方式监听目录。
- -q 安静模式,打印输出较少的内容。
- --timefmt 指定时间的输出格式。
- --format 指定事件输出的格式。
- -e 设置监听的事件类型。这里监听增删改和metadata的变更。
对于每次触发的监听时间,inotifywait会执行do和done之间的代码。在这里,我们调用之前所说的rsync命令进行文件同步。
直接执行下面命令开始监听:
nohup sh inotifywait-rsync.sh >/dev/null &