Elasticsearch也提供了备份集群中索引数据的策略——snapshot API.
它会备份整个集群的当前状态和数据,并保存到集群中各个节点共享的仓库中。
这个备份的进程是增量备份的,在第一次备份的基础上进行的第二次备份只备份新变化的数据。

创建elasticsearch快照进行备份。

1、 建立NFS文件共享服务
2、修改elasticsearch配置文件elasticsearch.yml,path.repo: **共享目录挂载的路径**,
3、创建快照仓库
4、创建快照
5、恢复快照到elasticsearch集群

 

建立NFS文件共享服务

服务端:
1、 安装NFS服务软件:

1 yum install rpcbind nfs-utils -y 

2、 建立需要共享的目录,并修改文件权限为666client用户访问id,在server中有,且对共享文件夹有rw权限

1 mkdir /udisk/elasticsnapshot
2 chmod 0666 /udisk/elasticsnapshot -R 

3、修改NFS服务配置文件, /etc/exports

/udisk/elasticsnapshot 10.9.121.211/32(rw,sync,all_squash) 10.9.134.110/32(rw,sync,all_squash) 10.9.90.103/32(rw,sync,all_squash) 10.19.36.230/32(rw,sync,all_squash) 10.19.63.103/32(rw,sync,all_squash)
# /udisk/elasticsnapshot 为共享的目录, 10.9.121.211/32 为可以挂载此共享目录的IP, 
# 参数说明:
# rw  ro 该目录分享的权限是可擦写 (read-write) 或只读 (read-only),但最终能不能读写,还是与文件系统的 rwx 及身份有关。
# sync  async sync 代表数据会同步写入到内存与硬盘中,async 则代表数据会先暂存于内存当中,而非直接写入硬盘!
# no_root_squash  root_squash 客户端使用 NFS 文件系统的账号若为 root 时,系统该如何判断这个账号的身份?预设的情况下,客户端 root 的身份会由 root_squash 的设定压缩成 nfsnobody, 如此对服务器的系统会较有保障。但如果你想要开放客户端使用 root 身份来操作服务器的文件系统,那么这里就得要开 no_root_squash 才行!
# all_squash 不论登入 NFS 的使用者身份为何, 他的身份都会被压缩成为匿名用户,通常也就是 nobody(nfsnobody) 啦!
# anonuid  anongid anon 意指 anonymous (匿名者) 前面关于 *_squash 提到的匿名用户的 UID 设定值,通常为 nobody(nfsnobody),但是你可以自行设定这个 UID 的值!当然,这个 UID 必需要存在于你的 /etc/passwd 当中! anonuid 指的是 UID 而 anongid 则是群组的 GID 啰。

4、 配置生效 exportfs -r
5、 启动服务

1 systemctl start rpcbind
2 systemctl start nfs

客户端:
1、安装客户端软件:

1 yum install nfs-utils -y 

2、新建挂载目录:mkdir /mnt/es
3、挂载共享目录: **为了提高NFS的稳定性,使用TCP协议挂载,NFS默认用UDP协议**

1 mount -t nfs 10.10.10.10:/udisk/elasticsnapshot /mnt/es -o proto=tcp -o nolock

4、每台ES机器为客户端,进行客户端配置

修改elasticsearch的配置文件elasticsearch.yml,添加下面配置,并重启

path.repo: '/mnt/es'
创建快照仓库
PUT /_snapshot/my_backup
{
"type": "fs",
"settings": {
"location": "/mnt/es",
"compress": true, # 是否压缩
"max_snapshot_bytes_per_sec": "50mb",
"max_restore_bytes_per_sec": "50mb"
}
}

创建快照

PUT /_snapshot/my_backup/back-2018-10-26
{
"indices": "*", # * 表示所有index, 可以具体写哪些"logstash-iis-2017-01-07,logstash-httperr-2017-01-07",
"ignore_unavailable": true,
"include_global_state": false
}

上面的代码会将所有正在运行的索引,备份到my_backup仓库下一个叫snapshot_1的快照中。上面的api会立刻返回,然后备份工作在后台运行。如果你想api同步执行,可以加wait_for_completion标志:

PUT /_snapshot/my_backup/snapshot_1?wait_for_completion=true 

查看快照

 1 get _snapshot/my_backup/back-2018-10-26
 2 # 会出现一下结果
 3 {
 4 "snapshots": [
 5 {
 6 "snapshot": "logstash-2017-01-07",
 7 "uuid": "0XM7X-HcR4u9Ou7-Gjzj5w",
 8 "version_id": 5000299,
 9 "version": "5.0.2",
10 "indices": [
11 "logstash-iis-2017-01-07",
12 "logstash-httperr-2017-01-07"
13 ],
14 "state": "SUCCESS",
15 "start_time": "2017-01-09T09:04:03.983Z",
16 "start_time_in_millis": 1483952643983,
17 "end_time": "2017-01-09T09:05:37.524Z",
18 "end_time_in_millis": 1483952737524,
19 "duration_in_millis": 93541,
20 "failures": [],
21 "shards": {
22 "total": 10,
23 "failed": 0,
24 "successful": 10
25 }
26 }
27 ]
28 }

 

1、查看所有索引的信息,使用如下api:

GET http://127.0.0.1:9200/_snapshot/my_backup/_all 

2、另外还有个一api可以看到更加详细的信息:

GET http://127.0.0.1:9200/_snapshot/my_backup/snapshot_3/_status 

快照恢复

post /_snapshot/my_backup/logstash-2017-01-07/_restore

1、 此api额外参数:

POST http://127.0.0.1:9200/_snapshot/my_backup/snapshot_1/_restore 
{ 
"indices": "index_1", 
"rename_pattern": "index_(.+)", 
"rename_replacement": "restored_index_$1" 
} 

参数indices 设置只恢复index_1索引,参数rename_pattern 和rename_replacement 用来正则匹配要恢复的索引,并且重命名。和备份一样,api会立刻返回值,然后在后台执行恢复,使用wait_for_completion 标记强制同步执行。
2、 另外可以使用下面两个api查看状态:

GET http://127.0.0.1:9200/_recovery/restored_index_3 
GET http://127.0.0.1:9200/_recovery/

3 取消恢复: 如果要取消恢复过程(不管是已经恢复完,还是正在恢复),直接删除索引即可