rsync
rsync
1. rsync介绍
Rsync全称为:“Remote synchronization”,是一个远程数据同步工具,支持本地复制,或者与其他SSH
、rsync
主机同步。
rsync不仅可以远程同步数据(类似于scp),而且可以本地同步数据(类似于cp),但不同于cp或scp的一点是,它不会覆盖以前的数据(如果数据已经存在),而是先判断已经存在的数据和新数据的差异,只有数据不同时才会把不相同的部分覆盖。
rsync的目的是实现本地主机和远程主机上的文件同步(包括本地推到远程,远程拉到本地两种同步方式),也可以实现本地不同路径下文件的同步,但不能实现远程路径1到远程路径2之间的同步(scp可以实现)。
2. rsync特性
rsync
支持很多特性:
- 可以镜像保存整个目录树和文件系统
- 可以很容易做到保持原来文件的权限、时间、软硬链接、文件acl,文件属性等
- 无须特殊权限即可安装
- 快速:第一次同步时
rsync
会复制全部内容,但在下一次只传输修改过的文件。rsync
在传输数据的过程中可以实行压缩及解压缩操作,因此可以使用更少的带宽 - 安全:可以使用
scp
、ssh
等方式来传输文件,当然也可以通过直接的socket
连接 - 支持匿名传输,以方便进行网站镜像,也可以做验证,加强安全
3. rsync的ssh认证协议
rsync
命令来同步系统文件之前要先登录remote
主机认证,认证过程中用到的协议有2种:
ssh
协议rsync
协议
rsync server`端不用启动`rsync`的`daemon`进程,只要获取`remote host`的用户名和密码就可以直接`rsync`同步文件 `rsync server`端因为不用启动`daemon`进程,所以也不用配置文件`/etc/rsyncd.conf
ssh
认证协议跟scp
的原理是一样的,如果在同步过程中不想输入密码就用ssh-keygen -t rsa
打通通道
//这种方式默认是省略了 -e ssh 的,与下面等价:
rsync -avz /SRC -e ssh root@172.16.12.129:/DEST
-a //文件宿主变化,时间戳不变
-z //压缩数据传输
//当遇到要修改端口的时候,我们可以:
rsync -avz /SRC -e "ssh -p2222" root@172.16.12.129:/DEST
//修改了ssh 协议的端口,默认是22
4. rsync命令
rsync命令是一个远程数据同步工具,可通过LAN/WAN快速同步多台主机间的文件。rsync使用所谓的“rsync算法”来使本地和远程两个主机之间的文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。 rsync是一个功能非常强大的工具,其命令也有很多功能特色选项,以下面就对它的选项一一进行分析说明。
语法
rsync [OPTION]... SRC DEST
rsync [OPTION]... SRC [USER@]host:DEST
rsync [OPTION]... [USER@]HOST:SRC DEST
rsync [OPTION]... [USER@]HOST::SRC DEST
rsync [OPTION]... SRC [USER@]HOST::DEST
rsync [OPTION]... rsync://[USER@]HOST[:PORT]/SRC [DEST]
其中,第一个路径参数一定是源文件路径,即作为同步基准的一方,可以同时指定多个源文件路径。最后一个路径参数则是目标文件路径,也就是待同步方。路径的格式可以是本地路径,也可以是使用user@host:path或user@host::path的远程路径。
如果主机和path路径之间使用单个冒号隔开,表示使用的是ssh协议
通信,而使用双冒号隔开的则表示的是连接rsync协议
。另外,使用rsync协议连接时,还提供了URL格式的路径表述方式rsync://user@host/path。
常用选项:
-v, --verbose 详细模式输出。
-q, --quiet 精简输出模式。
-c, --checksum 打开校验开关,强制对文件传输进行校验。
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD。
-r, --recursive 对子目录以递归模式处理。
-R, --relative 使用相对路径信息。
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀。
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件,不覆盖更新的文件。
-l, --links 保留软链结。
-p, --perms 保持文件权限。
-o, --owner 保持文件属主信息。
-g, --group 保持文件属组信息。
-D, --devices 保持设备文件信息。
-t, --times 保持文件时间信息。
-e, --rsh=command 指定使用rsh、ssh方式进行数据同步。
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息。
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件。
--delete 删除那些DST中SRC没有的文件。
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输。
--timeout=time ip超时时间,单位为秒。
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件。
--port=PORT 指定其他的rsync服务端口。
-stats 给出某些文件的传输状态。
--progress 在传输时现实传输过程。
--password-file=FILE 从FILE中得到密码。
-P 等同于 --partial。
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输。
#事件说明
access:读取文件或目录内容
modify:修改文件或目录内容
attrib:文件或目录的属性改变
close_write:修改真实文件内容 # 重要参数
close_nowrite:文件或目录关闭,在只读模式打开之后关闭的
close:文件或目录关闭,不管读或是写模式
open:文件或目录被打开
moved_to:文件或目录移动到
moved_from:文件或目录从移动
move:移动文件或目录移动到监视目录 # 重要参数
create:在监视目录下创建文件或目录 # 重要参数
delete:删除监视目录下的文件或目录 # 重要参数
delete_self:文件或目录被删除,目录本身被删除
unmount:卸载文件系统
5. rsync+inotify实时同步
rsync
与传统的cp
、tar
备份方式相比,rsync
具有安全性高、备份迅速、支持增量备份等优点,通过rsync
可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync
在高端业务系统中也逐渐暴露出了很多不足,首先,rsync
同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync
不能实时的去监测、同步数据,虽然它可以通过linux
守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync
+inotify
组合出现了!
Inotify
是一种强大的、细粒度的、异步的文件系统事件监控机制,linux
内核从2.6.13
起,加入了Inotify
支持,通过Inotify
可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools
就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通过crontab
守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify
可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync
同步,这样刚好解决了同步数据的实时性问题。
环境说明:
服务器类型 | IP地址 | 应用 | 操作系统 |
---|---|---|---|
源服务器(SRC) | 192.168.32.130 | rsync inotify-tools 脚本 | centos7/redhat7 |
目标服务器(DEST) | 192.168.32.135 | rsync | centos7/redhat7 |
均已关闭防火墙和selinux
需求:
- 把源服务器上/runtime目录实时同步到目标服务器的/backup/下
5.1 在目标服务器上配置rsync
#安装rsyn
[root@DEST ~]# yum -y install rsync
[root@DEST ~]# mkdir /backup
#设置rsyncd.conf配置文件,删除注释
cat >> /etc/rsyncd.conf <<EOF
log file = /var/log/rsyncd.log # 日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile = /var/run/rsyncd.pid # pid文件的存放位置
lock file = /var/run/rsync.lock # 支持max connections参数的锁文件
secrets file = /etc/rsync.pass # 用户认证配置文件,里面保存用户名称和密码,必须手动创建这个文件
[backup] # 自定义同步名称
path = /backup/ # rsync服务端数据存放路径,客户端的数据将同步至此目录
comment = sync etc from client
uid = root # 设置rsync运行权限为root
gid = root # 设置rsync运行权限为root
port = 873 # 默认端口
ignore errors # 表示出现错误忽略错误
use chroot = no # 默认为true,修改为no,增加对目录文件软连接的备份
read only = no # 设置rsync服务端为读写权限
list = no # 不显示rsync服务端资源列表
max connections = 200 # 最大连接数
timeout = 300 # 设置超时时间
auth users = admin # 执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow = 192.168.32.130 # 允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny = 192.168.1.1 # 禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
EOF
#创建用户认证文件
[root@DEST ~]# echo 'admin:123456' > /etc/rsync.pass
[root@DEST ~]# cat /etc/rsync.pass
admin:123456
#设置文件权限
[root@DEST ~]# chmod 600 /etc/rsync*
[root@DEST ~]# ll /etc/rsync*
-rw-------. 1 root root 1854 7月 28 10:05 /etc/rsyncd.conf
-rw-------. 1 root root 13 7月 28 10:06 /etc/rsync.pass
#启动rsync服务并设置开机自启动
[root@DEST ~]# systemctl enable --now rsyncd
Created symlink from /etc/systemd/system/multi-user.target.wants/rsyncd.service to /usr/lib/systemd/system/rsyncd.service.
[root@DEST ~]# ss -tanl
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 100 127.0.0.1:25 *:*
LISTEN 0 5 *:873 *:*
LISTEN 0 128 *:22 *:*
LISTEN 0 100 [::1]:25 [::]:*
LISTEN 0 5 [::]:873 [::]:*
LISTEN 0 128 [::]:22 [::]:*
5.2 在源服务器上配置rsync+inotify,编写出发式同步脚本
#配置epel源,inotify-tools在epel源中
[root@SRC ~]# yum -y install epel-release
#安装rsync服务端软件,只需要安装,不要启动,不需要配置
[root@SRC ~]# yum -y install rsync
#创建认证密码文件
[root@SRC ~]# echo '123456' > /etc/rsync.pass
[root@SRC ~]# cat /etc/rsync.pass
123456
#设置文件权限,只设置文件所有者具有读取、写入权限即可
[root@SRC ~]# chmod 600 /etc/rsync.pass
[root@SRC ~]# ll /etc/rsync.pass
-rw-------. 1 root root 7 Jul 27 22:13 /etc/rsync.pass
#在源服务器上创建测试目录,然后在源服务器运行以下命令,测试数据是否同步成功
[root@SRC ~]# mkdir -p /root/aaa/test
[root@SRC ~]# rsync -avH --port 873 --progress --delete /root/aaa/ admin@192.168.32.135::backup --password-file=/etc/rsync.pass
sending incremental file list
./
test/
sent 81 bytes received 27 bytes 216.00 bytes/sec
total size is 0 speedup is 0.00
//目标服务器同步成功
[root@DEST ~]# ls /backup/
test
#安装inotify-tools工具,实时触发rsync进行同步
#查看服务器内核是否支持inotify,有这三个max开头的文件则表示服务器内核支持inotify。2.6.13以后的内核都支持
[root@SRC ~]# ll /proc/sys/fs/inotify/
total 0
-rw-r--r--. 1 root root 0 Jul 27 22:41 max_queued_events
-rw-r--r--. 1 root root 0 Jul 27 22:41 max_user_instances
-rw-r--r--. 1 root root 0 Jul 27 22:41 max_user_watches
[root@SRC ~]# cat /proc/sys/fs/inotify/max_queued_events
16384
[root@SRC ~]# cat /proc/sys/fs/inotify/max_user_instances
128
[root@SRC ~]# cat /proc/sys/fs/inotify/max_user_watches
8192
#这是inotify 机制提供的三个调控参数
#max_queued_events:表示监控事件队列
#max_user_instances:最多监控实例数
#max_user_watches:每个实例最多监控文件数
#安装inotify-tools
[root@SRC ~]# yum -y install inotify-tools
#写同步脚本,让脚本自动去检测我们制定的目录下
#文件发生的变化,然后再执行rsync的命令把它同步到我们的服务器端去
#创建要监控的目录
[root@SRC ~]# mkdir /runtime
[root@SRC ~]# mkdir /scripts
[root@SRC ~]# touch /scripts/inotify.sh
[root@SRC ~]# chmod 755 /scripts/inotify.sh
[root@SRC ~]# vim /scripts/inotify.sh
host=192.168.32.135
src=/runtime
des=backup
password=/etc/rsync.pass
user=admin
inotifywait=/usr/bin/inotifywait
$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e close_write,modify,delete,create,attrib $src \
| while read files;do
rsync -avzP --delete --timeout=100 --password-file=${password} $src $user@$host::$des
echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done
#启动脚本
[root@SRC ~]# nohup bash /scripts/inotify.sh &
[1] 1417
[root@SRC ~]# nohup: ignoring input and appending output to ‘nohup.out’
[root@SRC ~]# ps -ef | grep inotify
root 1417 1307 0 22:52 pts/0 00:00:00 bash /scripts/inotify.sh
root 1418 1417 0 22:52 pts/0 00:00:00 /usr/bin/inotifywait -mrq --timefmt %Y%m%d %H:%M --format %T %w%f%e -e modify,delete,create,attrib /runtime
root 1419 1417 0 22:52 pts/0 00:00:00 bash /scripts/inotify.sh
root 1421 1307 0 22:53 pts/0 00:00:00 grep --color=auto inotify
#在源服务器上生成一个新文件
[root@SRC ~]# echo 'hello' > /runtime/abc
[root@SRC ~]# ls /runtime/
abc
#目标服务器上查看
[root@DEST ~]# ls /backup/runtime/
abc
[root@DEST ~]# cat /backup/runtime/abc
hello
#查看日志
[root@SRC ~]# tail /tmp/rsync.log
20200727 23:20 /runtime/abcCREATE was rsynced
20200727 23:20 /runtime/abcMODIFY was rsynced
5.3 设置脚本开机自动启动:
[root@SRC ~]# chmod +x /etc/rc.d/rc.local
[root@SRC ~]# ll /etc/rc.d/rc.local
-rwxr-xr-x. 1 root root 473 Aug 8 2019 /etc/rc.d/rc.local
[root@SRC ~]# echo 'nohup /bin/bash /scripts/inotify.sh' >> /etc/rc.d/rc.local
[root@SRC ~]# tail /etc/rc.d/rc.local
# to run scripts during boot instead of using this file.
#
# In contrast to previous versions due to parallel execution during boot
# this script will NOT be run after all other services.
#
# Please note that you must run 'chmod +x /etc/rc.d/rc.local' to ensure
# that this script will be executed during boot.
touch /var/lock/subsys/local
nohup /bin/bash /scripts/inotify.sh