rsync远程同步

rsync远程同步

rsync简介

rsync英文称为remote synchronizetion,从软件的名称就可以看出来,rsync具有可使本地和远程两台主机之间的数据快速复制同步镜像、远程备份的功能,这个功能类似于ssh带的scp命令,但是又优于scp命令的功能,scp每次都是全量拷贝,而rsync可以增量拷贝。当然,rsync还可以在本地主机的不同分区或目录之间全量及增量的复制数据,这又类似cp命令。但是同样也优于cp命令,cp每次都是全量拷贝,而rsync可以增量拷贝。

在同步数据的时候,默认情况下,rsync通过其独特的“quick check”算法,它仅同步大小或者最后修改时间发生变化的文件或目录,当然也可根据权限、属主等属性的变化同步,但是需要制定相应的参数,甚至可以实现只同步一个文件里有变化的内容部分,所以,可是实现快速的同步备份数据。

rsync特性

  • 支持拷贝特殊文件,如连接文件、设备等。
  • 可以有排除指定文件或目录同步的功能,相当于打包命令tar的排除功能。
  • 可以做到保持原文件或目录的权限、时间、软硬链接、属主、组等所有属性均不改变 –p。
  • 可以实现增量同步,既只同步发生变化的数据,因此数据传输效率很高(tar-N)。
  • 可以使用rcp、rsh、ssh等方式来配合传输文件(rsync本身不对数据加密)。
  • 可以通过socket(进程方式)传输文件和数据(服务端和客户端)*****。
  • 支持匿名的活认证(无需系统用户)的进程模式传输,可以实现方便安全的进行数据备份和镜像。

rsync生产场景

  • 借助cron+rsync把所有客户端服务器数据同步到备份服务器。

  • 针对公司重要数据备份混乱状况和领导提出备份全网数据的解决方案。

  • 通过本地打包备份,然后rsync结合inotify应用把全网数统一备份到一个固定存储服务器,然后在存储服务器上通过脚本检查并报警管理员备份结果。

  • 定期将IDC机房的数据 备份公司的内部服务器,防止机房地震及火灾问题导致数据丢失。

  • 实时同步,解决存储服务器等的单点问题。

rsync同步源

  • 在远程同步任务中,负责发起 rsync 同步操作的客户机称为客户端,而负责响应来自客户端的 rsync 同步操作的服务器称为备份源,也称之为同步源
    • 在下行同步(下载)中,同步源负责提供文档的原始位置,发起端应对该位置有读取权限
    • 在上行同步(上传)中,同步源负责提供文档的目标位置,发起端应对该位置具有写入权限

配置 Rsync 下行同步

配置rsync源服务器

systemctl stop firewalld.service
systemctl disable firewalld.service
setenforce 0

rpm -q rsync                   #一般系统已默认安装rsync 
#建立/etc/rsyncd.conf配置文件
vim /etc/rsyncd.conf           #添加以下配置项

uid = root
gid = root
use chroot = yes                #禁锢在源目录
address = 192.168.239.20         #监听地址
port 873                       #监听端口tcp/udp 873,可通过cat/etc/services I grep rsync查看
log file = /var/log/rsyncd.log   #日志文件位置
pid file = /var/run/rsyncd.pid   #存放进程ID的文件位置
hosts allow =192.168.239.0/24   #允许访问的客户机地址
dont compress   = *.gz *.tgz *.zip *.z *.Z *.rpm *.deb *.bz2#同步时不再压缩的文件类型

[wwwroot]                                   #共享模块名称
path = /var/www/html                        #源目录的实际路径
comment = folder of web
read only = yes                             #是否为只读
auth users = backuper                       #授权账户,多个账号以空格分隔
secrets file=/root/rsnyc_backupers         #存放账户信息的数据文件
#如采用匿名的方式,只要将其中的“auth users"和“secrets file”配置项去掉即可

#为备份账户创建数据文件
vim /root/rsnyc_backupers
backuper:1999612                           #无须建立同名系统用户
chmod 600 /root/rsnyc_backupers
#保证所有用户对源目录/var/www/html都有读取权限
chmod +r /var/www/html/
ls -d /var/www/html/

#启动rsync服务程序
rsync --daemon                  #启动rsync服务,以独立监听服务的方式(守护进程)运行

#关闭服务
kill $(cat /var/run/rsyncd.pid)
rm -rf /var/run/rsyncd.pid

关闭防火墙

编辑rsync配置文件

编辑用户账号文件,固定格式为[名称:密码],一行一个,并赋予文件权限及创建共享目录赋予读权限开启服务

发起端

基本格式
rsynd [选项] 原始位置 目标位置

常用选项:

选项 功能
-r 递归模式,包含目录及子目录中的所有文件。
-l 对于符号链接文件仍然复制为符号链接文件。
-v 显示同步过程的详细(verbose)信息。
-z 在传输文件时进行压缩(compress)。
-a 归档模式,保留文件的权限、属性等信息,等同于组合选项“-rlptgop"。
-p 保留文件的权限标记。
-t 保留文件的时间标记。
-g 保留文件的属组标记(仅超级用户使用)。
-o 保留文件的属主标记(仅超级用户使用)。
-H 保留硬连接文件。
-A 保留ACL属性信息。
-D 保留设备文件及其他特殊文件。
--delete 删除目标位置有而原始位置没有的文件。
--checksum 根据校验和(而不是文件大小、修改时间)来决定是否跳过文件。

服务器在共享目录存放文件

将指定的资源下载到本地/data目录下进行备份。
格式一:

rsync  -avz backuper @192.168.239.20::wwwroot /data

格式二:

rsync -avz rsync://backuper @192.168.239.20/wwwroot  /data/

免交互

格式配置:
echo "123123" >/etc/server.pass 

chmod 600 /etc/server.pass 
rsync -az --delete --password-file=/etc/server.pass backuper@192.168.239.20::wwwroot /data/
#为了在同步过程中不用输入密码,需要创建一个密码文件,保存backuper用户的密码,如/etc/server.pass。在执行rsync 同步时使用选项“--password-file=/etc/server.pass"指定即可。

也可以通过计划性任务对数据进行定期同步

crontab -e                               #添加计划性任务
30 22 * * * /usr/bin/rsync -az --delete --password-file=/etc/server.pass backuper@192.168.239.20::wwwroot /data/  #每天的10:30对数据进行同步
systemctl restart crond                  #重启计划任务服务  
systemctl enable crond                   #设置开机自启

rsync实时同步

定期同步的不足

  • 执行备份的时间固定,延迟明显、实时性差

  • 当同步源长期不变化时,密集的定期任务是不必要的

实时同步的优点

  • 一旦同步源出现变化,立即启动备份
  • 只要同步源无变化,则不执行备份

Linux内核的inotify机制

  • 从版本2.6.13开始提供
  • 可以监控文件系统的变动情况,并做出通知响应
  • 辅助软件:inotify-tools

配置Rsync+Inotify 实时同步

  • 使用inotify通知接口,可以用来监控文件系统的各种变化情况,如文件存取、删除、移动、修改等。利用这一机制,可以非常方便地实现文件异动告警、增量备份,并针对目录或文件的变化及时作出响应。
  • 将inotify机制与rsync工具相结合,可以实现触发式备份(实时同步),即只要原始位置的文档发生变化,则立即启动增量备份操作;否则处于静默等待状态。
  • 因为 inotify 通知机制由 Linux 内核提供,因此主要做本机监控,在触发式备份中应用时更适合上行同步

修改rsync源服务器配置

vim /etc/rsyncd.conf
read only = no                     #关闭只读 上行同步需要可以写
kill $(cat /var/run/rsyncd.pid)   #杀死进程等于关闭服务
rm -rf /var/run/rsyncd.pid         #要将服务的pid文件删除否则重启服务可能会起不来会报错
rsync --daemon                     #重启服务
netstat -anpt | grep rsync         #查看服务是否启动
chmod 777 /var/www/html/           #给共享目录可读可写可执行权限

调整客户机inotify 内核参数

  • 在Linux内核中,默认的inotify机制提供了三个调控参数:max_queue_events(监控事件队列,默认值为16384)、max_user_instances(最多监控实例数,默认值为128)、max_user_watches(每个实例最多监控文件数,默认值为8192)。当要监控的目录、文件数量较多或者变化较频繁时,建议加大这三个参数的值。
#查看参数值
cat /proc/sys/fs/inotify/max_queued_events
cat /proc/sys/fs/inotify/max_user_instances 
cat /proc/sys/fs/inotify/max_user_watches

vim /etc/sysctl.conf 
fs.inotify.max_queued_events = 16384
fs.inotify.max_user_instances = 1024
fs.inotify.max_user_watches = 1048576

sysctl -p  #加载参数

在客户机安装inotify-tools

  • 用inotify机制还需要安装 inotify-tools,以便提供inotifywait、inotifywatch 辅助工具程序,用来监控、汇总改动情况。
  • inotifywait:可监控modify(修改)、create(创建)、move(移动)、delete(删除)、attrib(属性更改)等各种事件,一有变动立即输出结果。
  • inotifywatch:可用来收集文件系统变动情况,并在运行结束后输出汇总的变化情况。
tar zxvf inotify-tools-3.14.tar.gz    #将软件包拉入/opt目录解压
cd /opt/inotify-tools-3.14            #进入目录
./configure && make && make install   #配置、编译安装
#可以先执行*inotifywait”命令,然后另外再开启一个新终端向/data目录下添加文件、移动文件,在原来的终端中跟踪屏幕输出结果。
inotifywait -mrq -e modify,create,move,delete /data
#选项“-e":用来指定要监控哪些事件
#选项“-m”:表示持续监控
#选项“-r":表示递归整个目录
#选项“-q”:简化输出信息

此时在开个终端对数据/data目录文件进行修改

再去查看监控情况

配置 Rsync 上行同步

修改rsync源服务器配置

vim /etc/rsyncd.conf
#添加上行共享模块
 [backupdir]
 path = /data
 comment = upload backup from client
 read only = no
 auth users = backuper
 secrets file = /root/rsnyc_backupers
 
 #重启服务
kill $(cat /var/run/rsyncd.pid)   
rm -rf /var/run/rsyncd.pid         
rsync --daemon                     
netstat -anpt | grep rsync  
mkdir /data

在客户机编写触发式同步脚本

注意,脚本名不可包含rsync字符串,否则脚本可能不生效

vim /opt/inotify.sh
#!/bin/bash
#定义inotifywait监控目录中文件事件的变量
INOTIEY_CMD="inotifywait -mrq -e modify,create,attrib,move,delete /data/"
#定义执行rsync上行同步的变量
RSYNC_CMD="rsync -azH --delete --password-file=/etc/server.pass /data/ backuper@192.168.239.20::backupdir/"
#使用while、read持续获取监控结果,根据结果可以进一步判断是否读取到输出的监控记录
$INOTIEY_CMD | while read DIRECTORY EVENT FILE
do
      if [ $(pgrep rsync | wc -l) -le 0 ] ; then
      #如果rsync未在执行,则立即启动
      $RSYNC_CMD
      fi
done
chmod +x inotify.sh

测试

客户机执行脚本并在共享目录内写入数据

 ./inotify.sh &   #后台执行脚本
cd /data
mkdir 123      
echo "123123" >123/index.html

服务器查看是否同步

设置开机自启动

chmod +x /etc/rc.d/rc.local  
echo "/root/inotify.sh" >> /etc/rc.d/rc.local #将脚本加入到开机自启配置文件内

如果同步的文件比较大同步时比较慢导致后面文件没来的及同步则需要在脚本内添加消息队列或缓冲

#!/bin/bash
#定义inotifywait监控目录中文件事件的变量
INOTIEY_CMD="inotifywait -mrq -e modify,create,attrib,move,delete /data/"
#定义执行rsync上行同步的变量
RSYNC_CMD="rsync -azH --delete --password-file=/etc/server.pass /data/ backuper@192.168.239.20::backupdir/"
#使用while、read持续获取监控结果,根据结果可以进一步判断是否读取到输出的监控记录
$INOTIEY_CMD | while read DIRECTORY EVENT FILE
do
      until [ $(pgrep rsync | wc -l) -le 0 ] 
      #小于等于0,则等待它执行完在去同步其他文件
      do
         sleep 1
      done
      $RSYNC_CMD
done

使用rsync来实现快速删除大量文件。

假如要在linux下删除大量文件,比如100万、1000万,像/usr/1ocal/nginx/proxy temp的nginx缓存等,那么rm-rf *可能就不好使了,因为要等待很长一段时间。在这种情况下我们可以使用rsync来巧妙处理。rsync实际用的是替换原理。

示例:
#先建立一个空的文件夹:
mkdir /123
#模拟大文件目录在目录下创建10000个文件
cd /opt
mkdir text
cd text
for ((i=1; i<=10000; i++)); do touch file$i; done
#用rsync删除目标目录这样目标目录很快就被清空了
rsync --delete-before -a -H -v --progress --stats /123/ /opt/text/
#注意删除文件时空目录要以/结尾否则删除不了
选项说明:
--delete-before 接收者在传输进行删除操作-a归档模式,表示以递归方式传输文件,并保持所有文件属性
-H保持硬连接的文件
-v详细输出模式
--progress在传输时显示传输过程
--stats给出某些文件的传输状态

posted @ 2022-06-15 00:23  GENGBO  阅读(198)  评论(0编辑  收藏  举报