第七章 lsyncd安装与使用

一、官方文档

https://axkibe.github.io/lsyncd/
https://github.com/axkibe/lsyncd

二、简介

Lsyncd使用文件系统事件接口(inotify或fsevents)来监视对本地文件和目录的更改。Lsyncd将这些事件整理几秒钟,然后生成一个或多个进程以将更改同步到远程文件系统。默认同步方法是rsync

Lsyncd是一种轻量级的实时镜像解决方案。Lsyncd相对容易安装,不需要新的文件系统或块设备。Lysncd不会妨碍本地文件系统性能

可以通过配置文件实现细粒度的自定义。自定义操作配置甚至可以从头开始编写,从shell脚本到用Lua语言编写的代码

三、几大实时同步工具的比较

1.inotify + rsync

最近一直在寻求生产服务服务器上的同步替代方案,原先使用的是inotify + rsync,但随着文件数量的增大到100W+,目录下的文件列表就达20M,在网络状况不佳或者限速的情况下,变更的文件可能10来个才几M,却因此要发送的文件列表就达20M,严重减低的带宽的使用效率以及同步效率;更为要紧的是,加入inotifywait在5s内监控到10个小文件发生变化,便会触发10个rsync同步操作,结果就是真正需要传输的才2-3M的文件,比对的文件列表就达200M。使用这两个组合的好处在于,它们都是最基本的软件,可以通过不同选项做到很精确的控制,比如排除同步的目录,同步多个模块或同步到多个主机。

2.sersync

sersync是国内的一个开发者开源出来的,使用c++编写,采用多线程的方式进行同步,失败后还有重传机制,对临时文件过滤,自带crontab定时同步功能。来说说它的优缺点:

1.国产开源,文档不是很全,在2011年之后就没更新了(googlecode都要快关闭了,其实可以转交其他人维护),网上关于它的使用和讨论都止于10年了

2.采用xml配置文件的方式,可读性比较好,但是有些原生的有些功能没有实现就没法使用了

3.无法实现多目录同步,只能通过多个配置文件启动多个进程。

4.文件排除功能太弱。

5.目前使用sersync2没什么问题,而且看了它的设计思路应该是比较科学的,特别是过滤队列的设计。双向同步看起来也是可以实现。

3. lsyncd

Lysncd 实际上是lua语言封装了 inotify 和 rsync 工具,采用了 Linux 内核(2.6.13 及以后)里的 inotify 触发机制,然后通过rsync去差异同步,达到实时的效果。我认为它最令人称道的特性是,完美解决了 inotify + rsync海量文件同步带来的文件频繁发送文件列表的问题:通过时间延迟或累计触发事件次数实现。另外,它的配置方式很简单,lua本身就是一种配置语言,可读性非常强。lsyncd也有多种工作模式可以选择,本地目录cp,本地目录rsync,远程目录rsyncssh。

实现简单高效的本地目录同步备份(网络存储挂载也当作本地目录),一个命令搞定。

四、安装lsyncd

安装lsyncd极为简单,一条yum命令即可!
[root@VM-0-15-centos ~]# yum install lsyncd -y

五、lsyncd配置文件说明

[root@VM-0-15-centos ~]# vim /etc/lsyncd.conf
-- 全局配置:
settings {
        logfile ="/var/log/lsyncd/lsyncd.log", -- 定义日志文件
        statusFile ="/var/log/lsyncd/lsyncd.status",  -- 定义状态文件
        pidfile = "/var/log/lsyncd/lsyncd.pid",-- 定义pid文件
        inotifyMode = "CloseWrite",-- 指定inotify监控的事件,默认是CloseWrite,还可以是Modify或CloseWrite or Modify
      	maxProcesses = 7,-- 同步进程的最大个数。假如同时有20个文件需要同步,而maxProcesses = 8,则最大能看到有8个rysnc进程
        nodaemon =true,-- 表示不启用守护模式,默认;
        maxDelays = 1, --  累计到多少所监控的事件激活一次同步,即使后面的delay延迟时间还未到
        inist = ture --keep running at startup although one or more targets failed due to not being reachable.  一般不用配置
       }

-- sync部分配置:
sync {
      default.rsync,     -- rsync、rsyncssh、direct三种模式:
    -- default.rsync :本地目录间同步,使用rsync,也可以达到使用ssh形式的远程rsync效果,或daemon方式连接远程rsyncd进程;
    -- default.direct :本地目录间同步,使用cp、rm等命令完成差异文件备份;
    -- default.rsyncssh :同步到远程主机目录,rsync的ssh模式,需要使用key来认证;
      source = "/tmp/src", -- source 同步的源目录,使用绝对路径
      target = "/tmp/dest", -- target 定义目的地址.对应不同的模式有几种写法:
    	-- /tmp/dest :本地目录同步,可用于direct和rsync模式;
    	-- 10.4.7.10:/tmp/dest :同步到远程服务器目录,可用于rsync和rsyncssh模式,拼接的命令类似于/usr/bin/rsync -ltsd --delete --include-from=- --exclude=* SOURCE TARGET,剩下的就是rsync的内容了,比如指定username,免密码同步;
   		-- 10.4.7.10::module :同步到远程服务器目录,用于rsync模式;
      init = true,  -- init 这是一个优化选项,当init = false,只同步进程启动以后发生改动事件的文件,原有的目录即使有差异也不会同步。默认是true;
      delay = 3, -- delay 累计事件,等待rsync同步延时时间,默认15秒(最大累计到1000个不可合并的事件)。也就是15s内监控目录下发生的改动,会累积到一次rsync同步,避免过于频繁的同步。(可合并的意思是,15s内两次修改了同一文件,最后只同步最新的文件);
      excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",  -- excludeFrom 排除选项,后面指定排除的列表文件,如excludeFrom = "/etc/lsyncd.exclude",如果是简单的排除,可以使用exclude = LIST。这里的排除规则写法与原生rsync有点不同,更为简单:
		-- 监控路径里的任何部分匹配到一个文本,都会被排除,例如/bin/foo/bar可以匹配规则foo
		-- 如果规则以斜线/开头,则从头开始要匹配全部
		-- 如果规则以/结尾,则要匹配监控路径的末尾
		-- ?匹配任何字符,但不包括/
		-- *匹配0或多个字符,但不包括/
		-- **匹配0或多个字符,可以是/
      delete	=	'running',  -- delete 为了保持target与souce完全同步,Lsyncd默认会delete = true来允许同步删除。它除了false,还有startup、running值:
      -- delete	=	true       # 在目标上删除源中没有的内容。在启动时以及在正常操作期间删除的内容
      -- delete	=	false      # 不会删除目标上的任何文件。不在启动时也不在正常操作上
      -- delete	=	'startup'  # Lsyncd将在启动时删除目标上的文件,但不会在正常操作时删除
      -- delete	=	'running'  # Lsyncd在启动时不会删除目标上的文件,但会删除正常操作期间删除的文件

    
-- rsync部分配置:    
      -- delete和exclude本来都是rsync的选项,上面是配置在sync中的,这样做的原因是为了减少rsync的开销
      rsync = {
             bwlimit=200, -- bwlimit 限速,单位kb/s,与rsync相同(这么重要的选项在文档里竟然没有标出);
             binary = "/usr/bin/rsync", -- rsync可执行程序地址,默认/usr/bin/rsync
             archive = true, -- 默认false,以递归方式传输文件,并保持所有文件属性
             compress = true,-- 压缩传输默认为true。在带宽与cpu负载之间权衡,本地目录同步可以考虑把它设为false;
             verbose = true,--同步详细模式输出
        	 perms = true -- perms 保留文件权限,默认为true;
      }
}

六、lsyncd常用配置文件

[root@VM-0-15-centos ~]# vim /etc/lsyncd.conf
settings {
        logfile ="/var/log/lsyncd/lsyncd.log",
        statusFile ="/var/log/lsyncd/lsyncd.status",
        inotifyMode = "CloseWrite",
        maxProcesses = 7,
        -- nodaemon =true,
       }
sync {
      default.rsync,
      source = "/tmp/src",
      target = "/tmp/dest",
      -- excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",
      rsync = {
             binary = "/usr/bin/rsync",
             archive = true,
             compress = true,
             verbose = true
      }
}

到这启动 lsycnd 就可以完成实时同步了,默认的许多参数可以满足绝大部分需求,非常简单。

七、启动lsyncd

[root@VM-0-15-centos ~]# systemctl start lsyncd
[root@VM-0-15-centos ~]# systemctl status lsyncd   # 确保状态是active (running)
# 自行查看source   target是否同步成功
[root@VM-0-15-centos ~]# systemctl enable lsyncd

八、lsyncd.conf其他模式示例

settings {
       logfile = "/var/log/lsyncd/lsyncd.log",
       statusFile = "/var/log/lsyncd/lsyncd.status",
       inotifyMode = "CloseWrite",
       maxProcesses = 8,
       }
# I. 本地目录同步directcp/rm/mv 适用500+万文件变动不大
sync {
     default.direct,
     source = "/tmp/src",
     target = "/tmp/dest",
     delay = 1
     maxProcesses = 1
     }
# II. 本地目录同步rsync模式rsync
sync {
     default.rsync,
     source = "/tmp/src",
     target = "/tmp/dest1",
     excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",
     rsync = {
             binary = "/usr/bin/rsync",
             archive = true,
             compress = true,
             bwlimit = 2000
             }
     }
# III. 远程目录同步rsync模式 + rsyncd daemon
sync {
     default.rsync,
     source = "/tmp/src",
     target = "syncuser@10.4.7.10::module1",
     delete="running",
     exclude = { ".*", ".tmp" },
     delay = 30,
     init = false,
     rsync = {
             binary = "/usr/bin/rsync",
             archive = true,
             compress = true,
             verbose = true,
             password_file = "/etc/rsyncd.d/rsync.pwd",
             _extra = {"--bwlimit=200"}
             }
     }
# IV. 远程目录同步rsync模式 + ssh shell
sync {
     default.rsync,
     source = "/tmp/src",
     target = "10.4.7.10:/tmp/dest",
     # target = "root@10.4.7.10:/remote/dest",
     # 上面target注意如果是普通用户必须拥有写权限
     maxDelays = 5,
     delay = 30,
     # init = true,
     rsync = {
             binary = "/usr/bin/rsync",
             archive = true,
             compress = true,
             bwlimit = 2000
             # rsh = "/usr/bin/ssh -p 22 -o StrictHostKeyChecking=no"
             # 如果要指定其它端口请用上面的rsh
     }
}
# V. 远程目录同步rsync模式 + rsyncssh效果与上面相同
sync {
     default.rsyncssh,
     source = "/tmp/src2",
     host = "10.4.7.10",
     targetdir = "/remote/dir",
     excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",
     # maxDelays = 5,
     delay = 0,
     # init = false,
     rsync = {
             binary = "/usr/bin/rsync",
             archive = true,
             compress = true,
             verbose = true,
             _extra = {"--bwlimit=2000"},
     },
     ssh = {
            port = 1234
     }
}
ps:
上面的内容几乎涵盖了所有同步的模式,其中第III个要求像rsync一样配置rsyncd服务端,见本文开头。第IV、V配置ssh方式同步,达到的效果相同,但实际同步时你会发现每次同步都会提示输入ssh的密码,配置免密登录即可!
posted @ 2022-10-27 15:30  年少纵马且长歌  阅读(1034)  评论(0编辑  收藏  举报