备份数据的重要性以及rsync的基本使用

备份数据的重要性和必要性


为啥需要进行数据备份

我们需要对一些比较重要的数据进行备份,防止数据的丢失

数据备份的方式

  • 全量备份 --- 会将所有的数据进行备份,效率比较低下

  • 增量备份 --- 只是将变动的数据进行备份,效率比较高,并且适合进行异地备份

数据备份的工具

  • scp:网络之间的拷贝,全量的拷贝方式,不推荐

  • rsync:远程增量备份工具


rsync的介绍

rsync是linux系统下的数据镜像备份工具。使用快速增量备份工具Remote Sync可以远程同步,支持本地复制,或者与其他SSH、rsync主机同步。

rsync的工作原理和场景

  • 推:所有主机推送本地数据到Rsync备份服务器,会导致数据同步缓慢(适合少量的数据备份)

  • 拉:rsync备份服务端拉取所有主机上的数据,会导致备份服务器开销过大

  • rsync大数据量备份

  • rsync异地数据备份


rsync数据传输方式

主要分成三种方式:

  • 本地传输 (类似于cp命令)

  • 远程传输(从a主机 ----> b主机)

  • 守护进程 (运行一个程序在后台)


rsync的参数介绍

rsync参数:-avz
-a           #归档模式传输, 等于-tropgDl
-v           #详细模式输出, 打印速率, 文件数量等
-z           #传输时进行压缩以提高效率
-r           #递归传输目录及子目录,即目录下得所有目录都同样传输。
-t           #保持文件时间信息
-o           #保持文件属主信息
-p           #保持文件权限
-g           #保持文件属组信息
-l           #保留软连接
-P           #显示同步的过程及传输时的进度等信息
-D           #保持设备文件信息
-L           #保留软连接指向的目标文件
-e           #使用的信道协议,指定替代rsh的shell程序  ssh
--exclude=PATTERN   #指定排除不需要传输的文件模式
--exclude-from=file #文件名所在的目录文件
--bwlimit=100       #限速传输
--partial           #断点续传
--delete            #让目标目录和源目录数据保持一致
注意:一般我们只需要使用avz这三个参数即可


本地传输

由于本地传输,我们一般用cp就可以了,所以本地传输使用rsync大材小用


远程传输

1.推送方式

废话不多说,直接看例子

rsync -avz anaconda-ks.cfg root@192.168.79.1:/tmp
将本地的 anaconda-ks.cfg 文件,推送到192.168.79.1的tmp目录下面,使用的是root身份推送

2.拉取方式

rsync -avz  root@192.168.79.1:/tmp/services ./
将远程服务器192.168.79.1的tmp目录下面的services,拉取到当前目录下面
但是上述传输方式存在两个问题:
1.使用系统用户(不安全) 2.使用普通用户(会导致权限不足情况)

因此,接下来,我们使用后台进程的方式,来进行文件的传输:


后台服务进程方式

具体的命令格式如下:

下载 Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST]
上传 Push: rsync [OPTION...] SRC... [USER@]HOST::DEST
在使用上述命令格式之前,我们需要进行前期的配置,如下:

a.先来看一下实验环境:

主机角色        外网IP(NAT)       内网IP(LAN)       主机名称 

Rsync服务端        10.0.0.41       172.16.1.41     backup 

Rsync客户端        10.0.0.31       172.16.1.31    nfs

b.需要在服务端安装rsyncd服务

yum install rsync -y

c.配置服务

[root@backup ~]# rpm -qc rsync
    /etc/rsyncd.conf            # 主配置文件
    /etc/sysconfig/rsyncd       # 选项


[root@backup ~]# vim /etc/rsyncd.conf
uid = rsync                      # 运行进程的用户
gid = rsync                      # 运行进程的用户组
port = 873                       # 监听端口
fake super = yes                 # 无需让rsync以root身份运行,允许接收文件的完整属性
use chroot = no                  # 禁锢推送的数据至某个目录, 不允许跳出该目录
max connections = 200            # 最大连接数
timeout = 600                    # 超时时间
ignore errors                    # 忽略错误信息
read only = false                # 对备份数据可读写
list = false                     # 不允许查看模块信息
auth users = rsync_backup        # 定义虚拟用户,作为连接认证用户
secrets file = /etc/rsync.passwd # 定义rsync服务用户连接认证密码文件路径


[backup]                # 定义模块信息
comment = commit        # 模块注释信息
path = /backup          # 定义接收备份数据目录

c.创建rsync进程启动时需要使用的用户

[root@backup ~]# useradd rsync -M -s /sbin/nologin 
[root@backup ~]# id rsync
uid=1000(rsync) gid=1000(rsync) groups=1000(rsync)

d.创建密码文件,在密码文件中写入对应的虚拟用户以及虚拟用户的密码

/etc/rsync.passwd---》rsync虚拟用户以及rsync虚拟用户的密码
[root@backup ~]# echo "rsync_backup:123456" > /etc/rsync.passwd
[root@backup ~]# chmod 600 /etc/rsync.passwd

e.创建存储备份数据的目录,并进行授权

[root@backup ~]# mkdir /backup
[root@backup ~]# chown -R rsync.rsync /backup/

f.启动rsync服务并加入开机自启动

[root@backup ~]# systemctl start rsyncd.service 
[root@backup ~]# systemctl enable rsyncd


检查rsync的873端口是否存在
[root@backup ~]# netstat -lntp
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:873             0.0.0.0:*               LISTEN      11129/rsync
g.客户端开始进行测试
客户端nfs推送(注意加/ 和不加/的区别)
[root@nfs ~]# rsync -avz /etc/ rsync_backup@172.16.1.41::backup #推送/etc/下面的内容
[root@nfs ~]# rsync -avz /etc rsync_backup@172.16.1.41::backup  #推送/etc这个目录


客户端拉取
[root@nfs ~]# rsync -avz rsync_backup@172.16.1.41::backup /opt
拉取服务端172.16.1.41的backup目录下面的所有内容至本地的 /opt目录

在上述过程中,我们需要注意下面几点:

注意事项

  • rsync_backup:客户端通过该虚拟用户连接rsync服务
    是一个虚拟用户,由服务端的配置文件中定义【auth users】
    通常存放在指定的一个文件中,该文件也是有服务端配置文件定义【secrets file】

  • rsync:【模块对应的目录,必须授权为配置文件中定义的uid和gid的用户】
    用于运行rsync服务时需要使用到的系统用户
    用于将接收到的数据以自己的身份写入到对应的目录中

到此,使用后台进程的方式配置完成


rsync实现客户端与服务端无差异同步

简单点说,就是在客户端这边删除了文件的话,则服务端同步的那个文件也会被删掉

具体实现的命令:

#推送方式实现无差异,以客户端为准,客户端有什么服务端就有什么
[root@nfs ~]# rsync -avz --delete /root rsync_backup@172.16.1.41::backup        


#拉取方式实现无差异,以服务端为准,服务端有什么客户端就有什么
[root@nfs ~]# rsync -avz --delete rsync_backup@172.16.1.41::backup /opt/

rsync 传输的时候限速

有的时候,我们传输文件会占满整个带宽,因此,为了避免这种情况,我们会对传输的速度进行限制

具体实现的命令如下:

对传输时候进行限速:
[root@nfs ~]# dd if=/dev/zero of=./size.disk bs=1M count=500  生成大文件


限制传输的速率为1MB 
[root@nfs ~]# rsync -avzP --bwlimit=1 ./size.disk rsync_backup@172.16.1.41::backup
Password: 
sending incremental file list
size.disk
    118,358,016  22%    1.01MB/s    0:06:33

上述中,--bwlimit代表的就是限速,单位是MB/S

posted @ 2020-10-17 13:23  码农编程进阶笔记  阅读(190)  评论(0编辑  收藏  举报
返回顶部 有事您Q我