elasticsearch 使用快照进行备份

Elasticsearch也提供了备份集群中索引数据的策略——snapshot API.
它会备份整个集群的当前状态和数据，并保存到集群中各个节点共享的仓库中。
这个备份的进程是增量备份的，在第一次备份的基础上进行的第二次备份只备份新变化的数据。

创建elasticsearch快照进行备份。

1、建立NFS文件共享服务
2、修改elasticsearch配置文件elasticsearch.yml，path.repo: **共享目录挂载的路径**，
3、创建快照仓库
4、创建快照
5、恢复快照到elasticsearch集群

建立NFS文件共享服务

服务端：
1、安装NFS服务软件:

1 yum install rpcbind nfs-utils -y

2、建立需要共享的目录，并修改文件权限为666, client用户访问id，在server中有，且对共享文件夹有rw权限。

1 mkdir /udisk/elasticsnapshot
2 chmod 0666 /udisk/elasticsnapshot -R

3、修改NFS服务配置文件， /etc/exports

/udisk/elasticsnapshot 10.9.121.211/32(rw,sync,all_squash) 10.9.134.110/32(rw,sync,all_squash) 10.9.90.103/32(rw,sync,all_squash) 10.19.36.230/32(rw,sync,all_squash) 10.19.63.103/32(rw,sync,all_squash)
# /udisk/elasticsnapshot 为共享的目录， 10.9.121.211/32 为可以挂载此共享目录的IP， 
# 参数说明：
# rw　　ro 该目录分享的权限是可擦写 (read-write) 或只读 (read-only)，但最终能不能读写，还是与文件系统的 rwx 及身份有关。
# sync　　async sync 代表数据会同步写入到内存与硬盘中，async 则代表数据会先暂存于内存当中，而非直接写入硬盘！
# no_root_squash　　root_squash 客户端使用 NFS 文件系统的账号若为 root 时，系统该如何判断这个账号的身份？预设的情况下，客户端 root 的身份会由 root_squash 的设定压缩成 nfsnobody， 如此对服务器的系统会较有保障。但如果你想要开放客户端使用 root 身份来操作服务器的文件系统，那么这里就得要开 no_root_squash 才行！
# all_squash 不论登入 NFS 的使用者身份为何， 他的身份都会被压缩成为匿名用户，通常也就是 nobody(nfsnobody) 啦！
# anonuid　　anongid anon 意指 anonymous (匿名者) 前面关于 *_squash 提到的匿名用户的 UID 设定值，通常为 nobody(nfsnobody)，但是你可以自行设定这个 UID 的值！当然，这个 UID 必需要存在于你的 /etc/passwd 当中！ anonuid 指的是 UID 而 anongid 则是群组的 GID 啰。

4、配置生效 exportfs -r
5、启动服务

1 systemctl start rpcbind
2 systemctl start nfs

客户端：
1、安装客户端软件：

1 yum install nfs-utils -y

2、新建挂载目录：mkdir /mnt/es
3、挂载共享目录： **为了提高NFS的稳定性，使用TCP协议挂载，NFS默认用UDP协议**

1 mount -t nfs 10.10.10.10:/udisk/elasticsnapshot /mnt/es -o proto=tcp -o nolock

4、每台ES机器为客户端，进行客户端配置

修改elasticsearch的配置文件elasticsearch.yml，添加下面配置，并重启

path.repo: '/mnt/es'

创建快照仓库

PUT /_snapshot/my_backup
{
"type": "fs",
"settings": {
"location": "/mnt/es",
"compress": true, # 是否压缩
"max_snapshot_bytes_per_sec": "50mb",
"max_restore_bytes_per_sec": "50mb"
}
}

创建快照

PUT /_snapshot/my_backup/back-2018-10-26
{
"indices": "*", # * 表示所有index， 可以具体写哪些"logstash-iis-2017-01-07,logstash-httperr-2017-01-07",
"ignore_unavailable": true,
"include_global_state": false
}

上面的代码会将所有正在运行的索引，备份到my_backup仓库下一个叫snapshot_1的快照中。上面的api会立刻返回，然后备份工作在后台运行。如果你想api同步执行，可以加wait_for_completion标志：

PUT /_snapshot/my_backup/snapshot_1?wait_for_completion=true

查看快照

 1 get _snapshot/my_backup/back-2018-10-26
 2 # 会出现一下结果
 3 {
 4 "snapshots": [
 5 {
 6 "snapshot": "logstash-2017-01-07",
 7 "uuid": "0XM7X-HcR4u9Ou7-Gjzj5w",
 8 "version_id": 5000299,
 9 "version": "5.0.2",
10 "indices": [
11 "logstash-iis-2017-01-07",
12 "logstash-httperr-2017-01-07"
13 ],
14 "state": "SUCCESS",
15 "start_time": "2017-01-09T09:04:03.983Z",
16 "start_time_in_millis": 1483952643983,
17 "end_time": "2017-01-09T09:05:37.524Z",
18 "end_time_in_millis": 1483952737524,
19 "duration_in_millis": 93541,
20 "failures": [],
21 "shards": {
22 "total": 10,
23 "failed": 0,
24 "successful": 10
25 }
26 }
27 ]
28 }

1、查看所有索引的信息，使用如下api:

GET http://127.0.0.1:9200/_snapshot/my_backup/_all

2、另外还有个一api可以看到更加详细的信息：

GET http://127.0.0.1:9200/_snapshot/my_backup/snapshot_3/_status

快照恢复

post /_snapshot/my_backup/logstash-2017-01-07/_restore

1、此api额外参数：

POST http://127.0.0.1:9200/_snapshot/my_backup/snapshot_1/_restore 
{ 
"indices": "index_1", 
"rename_pattern": "index_(.+)", 
"rename_replacement": "restored_index_$1" 
}

参数indices 设置只恢复index_1索引，参数rename_pattern 和rename_replacement 用来正则匹配要恢复的索引，并且重命名。和备份一样，api会立刻返回值，然后在后台执行恢复，使用wait_for_completion 标记强制同步执行。
2、另外可以使用下面两个api查看状态：

GET http://127.0.0.1:9200/_recovery/restored_index_3 
GET http://127.0.0.1:9200/_recovery/

3 取消恢复：如果要取消恢复过程（不管是已经恢复完，还是正在恢复），直接删除索引即可

发表于 2019-02-12 10:59 宇宙中漂浮的猫阅读(3475) 评论(0) 收藏举报

刷新页面返回顶部

宇宙中漂浮的猫
博客园首页新随笔联系订阅管理

elasticsearch 使用快照进行备份

公告