第七章 lsyncd安装与使用
一、官方文档
https://axkibe.github.io/lsyncd/
https://github.com/axkibe/lsyncd
二、简介
Lsyncd使用文件系统事件接口(inotify或fsevents)来监视对本地文件和目录的更改。Lsyncd将这些事件整理几秒钟,然后生成一个或多个进程以将更改同步到远程文件系统。默认同步方法是rsync
Lsyncd是一种轻量级的实时镜像解决方案。Lsyncd相对容易安装,不需要新的文件系统或块设备。Lysncd不会妨碍本地文件系统性能
可以通过配置文件实现细粒度的自定义。自定义操作配置甚至可以从头开始编写,从shell脚本到用Lua语言编写的代码
三、几大实时同步工具的比较
1.inotify + rsync
最近一直在寻求生产服务服务器上的同步替代方案,原先使用的是inotify + rsync,但随着文件数量的增大到100W+,目录下的文件列表就达20M,在网络状况不佳或者限速的情况下,变更的文件可能10来个才几M,却因此要发送的文件列表就达20M,严重减低的带宽的使用效率以及同步效率;更为要紧的是,加入inotifywait在5s内监控到10个小文件发生变化,便会触发10个rsync同步操作,结果就是真正需要传输的才2-3M的文件,比对的文件列表就达200M。使用这两个组合的好处在于,它们都是最基本的软件,可以通过不同选项做到很精确的控制,比如排除同步的目录,同步多个模块或同步到多个主机。
2.sersync
sersync是国内的一个开发者开源出来的,使用c++编写,采用多线程的方式进行同步,失败后还有重传机制,对临时文件过滤,自带crontab定时同步功能。来说说它的优缺点:
1.国产开源,文档不是很全,在2011年之后就没更新了(googlecode都要快关闭了,其实可以转交其他人维护),网上关于它的使用和讨论都止于10年了
2.采用xml配置文件的方式,可读性比较好,但是有些原生的有些功能没有实现就没法使用了
3.无法实现多目录同步,只能通过多个配置文件启动多个进程。
4.文件排除功能太弱。
5.目前使用sersync2没什么问题,而且看了它的设计思路应该是比较科学的,特别是过滤队列的设计。双向同步看起来也是可以实现。
3. lsyncd
Lysncd 实际上是lua语言封装了 inotify 和 rsync 工具,采用了 Linux 内核(2.6.13 及以后)里的 inotify 触发机制,然后通过rsync去差异同步,达到实时的效果。我认为它最令人称道的特性是,完美解决了 inotify + rsync海量文件同步带来的文件频繁发送文件列表的问题:通过时间延迟或累计触发事件次数实现。另外,它的配置方式很简单,lua本身就是一种配置语言,可读性非常强。lsyncd也有多种工作模式可以选择,本地目录cp,本地目录rsync,远程目录rsyncssh。
实现简单高效的本地目录同步备份(网络存储挂载也当作本地目录),一个命令搞定。
四、安装lsyncd
安装lsyncd极为简单,一条yum命令即可!
[root@VM-0-15-centos ~]# yum install lsyncd -y
五、lsyncd配置文件说明
[root@VM-0-15-centos ~]# vim /etc/lsyncd.conf
-- 全局配置:
settings {
logfile ="/var/log/lsyncd/lsyncd.log", -- 定义日志文件
statusFile ="/var/log/lsyncd/lsyncd.status", -- 定义状态文件
pidfile = "/var/log/lsyncd/lsyncd.pid",-- 定义pid文件
inotifyMode = "CloseWrite",-- 指定inotify监控的事件,默认是CloseWrite,还可以是Modify或CloseWrite or Modify
maxProcesses = 7,-- 同步进程的最大个数。假如同时有20个文件需要同步,而maxProcesses = 8,则最大能看到有8个rysnc进程
nodaemon =true,-- 表示不启用守护模式,默认;
maxDelays = 1, -- 累计到多少所监控的事件激活一次同步,即使后面的delay延迟时间还未到
inist = ture --keep running at startup although one or more targets failed due to not being reachable. 一般不用配置
}
-- sync部分配置:
sync {
default.rsync, -- rsync、rsyncssh、direct三种模式:
-- default.rsync :本地目录间同步,使用rsync,也可以达到使用ssh形式的远程rsync效果,或daemon方式连接远程rsyncd进程;
-- default.direct :本地目录间同步,使用cp、rm等命令完成差异文件备份;
-- default.rsyncssh :同步到远程主机目录,rsync的ssh模式,需要使用key来认证;
source = "/tmp/src", -- source 同步的源目录,使用绝对路径
target = "/tmp/dest", -- target 定义目的地址.对应不同的模式有几种写法:
-- /tmp/dest :本地目录同步,可用于direct和rsync模式;
-- 10.4.7.10:/tmp/dest :同步到远程服务器目录,可用于rsync和rsyncssh模式,拼接的命令类似于/usr/bin/rsync -ltsd --delete --include-from=- --exclude=* SOURCE TARGET,剩下的就是rsync的内容了,比如指定username,免密码同步;
-- 10.4.7.10::module :同步到远程服务器目录,用于rsync模式;
init = true, -- init 这是一个优化选项,当init = false,只同步进程启动以后发生改动事件的文件,原有的目录即使有差异也不会同步。默认是true;
delay = 3, -- delay 累计事件,等待rsync同步延时时间,默认15秒(最大累计到1000个不可合并的事件)。也就是15s内监控目录下发生的改动,会累积到一次rsync同步,避免过于频繁的同步。(可合并的意思是,15s内两次修改了同一文件,最后只同步最新的文件);
excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst", -- excludeFrom 排除选项,后面指定排除的列表文件,如excludeFrom = "/etc/lsyncd.exclude",如果是简单的排除,可以使用exclude = LIST。这里的排除规则写法与原生rsync有点不同,更为简单:
-- 监控路径里的任何部分匹配到一个文本,都会被排除,例如/bin/foo/bar可以匹配规则foo
-- 如果规则以斜线/开头,则从头开始要匹配全部
-- 如果规则以/结尾,则要匹配监控路径的末尾
-- ?匹配任何字符,但不包括/
-- *匹配0或多个字符,但不包括/
-- **匹配0或多个字符,可以是/
delete = 'running', -- delete 为了保持target与souce完全同步,Lsyncd默认会delete = true来允许同步删除。它除了false,还有startup、running值:
-- delete = true # 在目标上删除源中没有的内容。在启动时以及在正常操作期间删除的内容
-- delete = false # 不会删除目标上的任何文件。不在启动时也不在正常操作上
-- delete = 'startup' # Lsyncd将在启动时删除目标上的文件,但不会在正常操作时删除
-- delete = 'running' # Lsyncd在启动时不会删除目标上的文件,但会删除正常操作期间删除的文件
-- rsync部分配置:
-- delete和exclude本来都是rsync的选项,上面是配置在sync中的,这样做的原因是为了减少rsync的开销
rsync = {
bwlimit=200, -- bwlimit 限速,单位kb/s,与rsync相同(这么重要的选项在文档里竟然没有标出);
binary = "/usr/bin/rsync", -- rsync可执行程序地址,默认/usr/bin/rsync
archive = true, -- 默认false,以递归方式传输文件,并保持所有文件属性
compress = true,-- 压缩传输默认为true。在带宽与cpu负载之间权衡,本地目录同步可以考虑把它设为false;
verbose = true,--同步详细模式输出
perms = true -- perms 保留文件权限,默认为true;
}
}
六、lsyncd常用配置文件
[root@VM-0-15-centos ~]# vim /etc/lsyncd.conf
settings {
logfile ="/var/log/lsyncd/lsyncd.log",
statusFile ="/var/log/lsyncd/lsyncd.status",
inotifyMode = "CloseWrite",
maxProcesses = 7,
-- nodaemon =true,
}
sync {
default.rsync,
source = "/tmp/src",
target = "/tmp/dest",
-- excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",
rsync = {
binary = "/usr/bin/rsync",
archive = true,
compress = true,
verbose = true
}
}
到这启动 lsycnd 就可以完成实时同步了,默认的许多参数可以满足绝大部分需求,非常简单。
七、启动lsyncd
[root@VM-0-15-centos ~]# systemctl start lsyncd
[root@VM-0-15-centos ~]# systemctl status lsyncd # 确保状态是active (running)
# 自行查看source target是否同步成功
[root@VM-0-15-centos ~]# systemctl enable lsyncd
八、lsyncd.conf其他模式示例
settings {
logfile = "/var/log/lsyncd/lsyncd.log",
statusFile = "/var/log/lsyncd/lsyncd.status",
inotifyMode = "CloseWrite",
maxProcesses = 8,
}
# I. 本地目录同步directcp/rm/mv 适用500+万文件变动不大
sync {
default.direct,
source = "/tmp/src",
target = "/tmp/dest",
delay = 1
maxProcesses = 1
}
# II. 本地目录同步rsync模式rsync
sync {
default.rsync,
source = "/tmp/src",
target = "/tmp/dest1",
excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",
rsync = {
binary = "/usr/bin/rsync",
archive = true,
compress = true,
bwlimit = 2000
}
}
# III. 远程目录同步rsync模式 + rsyncd daemon
sync {
default.rsync,
source = "/tmp/src",
target = "syncuser@10.4.7.10::module1",
delete="running",
exclude = { ".*", ".tmp" },
delay = 30,
init = false,
rsync = {
binary = "/usr/bin/rsync",
archive = true,
compress = true,
verbose = true,
password_file = "/etc/rsyncd.d/rsync.pwd",
_extra = {"--bwlimit=200"}
}
}
# IV. 远程目录同步rsync模式 + ssh shell
sync {
default.rsync,
source = "/tmp/src",
target = "10.4.7.10:/tmp/dest",
# target = "root@10.4.7.10:/remote/dest",
# 上面target注意如果是普通用户必须拥有写权限
maxDelays = 5,
delay = 30,
# init = true,
rsync = {
binary = "/usr/bin/rsync",
archive = true,
compress = true,
bwlimit = 2000
# rsh = "/usr/bin/ssh -p 22 -o StrictHostKeyChecking=no"
# 如果要指定其它端口请用上面的rsh
}
}
# V. 远程目录同步rsync模式 + rsyncssh效果与上面相同
sync {
default.rsyncssh,
source = "/tmp/src2",
host = "10.4.7.10",
targetdir = "/remote/dir",
excludeFrom = "/etc/rsyncd.d/rsync_exclude.lst",
# maxDelays = 5,
delay = 0,
# init = false,
rsync = {
binary = "/usr/bin/rsync",
archive = true,
compress = true,
verbose = true,
_extra = {"--bwlimit=2000"},
},
ssh = {
port = 1234
}
}
ps:
上面的内容几乎涵盖了所有同步的模式,其中第III个要求像rsync一样配置rsyncd服务端,见本文开头。第IV、V配置ssh方式同步,达到的效果相同,但实际同步时你会发现每次同步都会提示输入ssh的密码,配置免密登录即可!