ElasticSearch recovery流程

为什么需要recovery?对于主分片来说,可能有一些数据没来得及
刷盘;对于副分片来说,一是没刷盘,二是主分片写完了,副分片还没
来得及写,主副分片数据不一致。
1. 主分片recovery
由于每次写操作都会记录事务日志(translog),事务日志中记录
了哪种操作,以及相关的数据。因此将最后一次提交(Lucene 的一次提
交就是一次 fsync 刷盘的过程)之后的 translog中进行重放,建立Lucene
索引,如此完成主分片的recovery。
2. 副分片recovery
副分片的恢复是比较复杂的,在ES的版本迭代中,副分片恢复策略
有过不少调整。
副分片需要恢复成与主分片一致,同时,恢复期间允许新的索引操
作。在目前的6.0版本中,恢复分成两阶段执行。
· phase1:在主分片所在节点,获取translog保留锁,从获取保留锁
开始,会保留translog不受其刷盘清空的影响。然后调用Lucene接口把
shard做快照,这是已经刷磁盘中的分片数据。把这些shard数据复制到
副本节点。在phase1完毕前,会向副分片节点发送告知对方启动
engine,在phase2开始之前,副分片就可以正常处理写请求了。
· phase2:对translog做快照,这个快照里包含从phase1开始,到执
行translog快照期间的新增索引。将这些translog发送到副分片所在节点
进行重放。
由于需要支持恢复期间的新增写操作(让ES的可用性更强),这两
个阶段中需要重点关注以下几个问题。
分片数据完整性:如何做到副分片不丢数据?第二阶段的 translog
快照包括第一阶段所有的新增操作。那么第一阶段执行期间如果发
生“Lucene commit”(将文件系统写缓冲中的数据刷盘,并清空
translog),清除translog怎么办?在ES 2.0之前,是阻止了刷新操作,以
此让translog都保留下来。从2.0版本开始,为了避免这种做法产生过大
的translog,引入了translog.view的概念,创建 view 可以获取后续的所有
操作。从6.0版本开始,translog.view 被移除。引入
TranslogDeletionPolicy的概念,它将translog做一个快照来保持translog不
被清理。这样实现了在第一阶段允许Lucene commit。

posted @ 2022-12-24 16:54  Cetus-Y  阅读(154)  评论(0编辑  收藏  举报