[整理] Elasticsearch 自定义分片分配

ElasticSearch 索引分片
自定义分片坐落节点
实践过程

ElasticSearch 索引分片

在 es 的概念中，最重要的一个概念便是索引。
索引是真实数据的载体，对索引的管理如果不慎重，则会带来很多的性能问题。

用过es的小伙伴都应该了解，我们应该在创建索引的时候为索引创建分片数，并且一个索引的分片数一经指定后就不能再修改（相比，副本数可以通过命令随时更改）。

在通常情况下，我们都会通过预判数据量级和过度分配这一策略，来避免因数据量过大或QPS增长带来的必须需要迁移索引的场景。

关于具体分片和过度分配以及相关分配策略的介绍，请移步选择恰当的分片数量和分片副本数量。

自定义分片坐落节点

在我们的生产中，遇到了一个实际问题：在一个集群中，有两个索引比其余索引在数据量和 QPS 上的要求都高很多，这样在很多时候这两个索引会影响其余索引的性能。

在阅读了 elasticsearch 的相关文档后，我们可以通过给集群打tag的方式，来将集群划分为几个子域，从而实现对特殊索引进行指定节点存储，使得其不影响其他索引的性能，同时虽然我们将 es 的节点划分为不同子域，但是实际上还是属于同一集群，对外提供服务，该改动对外界无感知，也做到了最小修改的情况下解决问题。

实践过程

调研 es 官方支持

在 elasticsearch 官方文档的 IndexModules -> Index Shard Allocation 节的介绍中，我们可以通过 elasticsearch 原生提供的一些设置来对分片的分配进行手动干预。

在 elasticsearch 中，提供了一种叫做 Shard Allocation Filtering 的策略。官方对于该策略的描述翻译过来是：

Shard Allocation Filtering 允许你来指定索引分片允许被坐落在哪个节点

在该部分文档的介绍中，可以了解到，我们可以通过给集群节点打tag的形式来给一个 elasticsearch 集群进行子域划分，从而指定某索引坐落在特定子域。

该过程的具体实现如下。

给集群打 tag

我们可以通过启动时指定参数和在 elasticsearch.yml 文件配置两种方式来实现为集群打标签，具体如下。

示例中，我们给集群添加 domain 属性。

# 启动参数指定
./elasticsearch -Enode.attr.domain=domain1
# yml 配置文件指定
node.attr.domain: domain1

通过以上任一方法，便可实现对节点的配置添加。

注：该属性不在 elasticsearch 提供的可以热更新的配置中，故任一方法配置后均需要对 elasticsearch 进行重新启动

给索引添加配置

在给节点添加完配置后，我们在创建索引时，即可通过在 settings 中指定的方式，来实现将该索引的分片分配在指定机器（子域）的效果，该配置如下。

{
    "index.routing.allocation.include.domain": "domain1"
}

通过添加以上设置，便可将该索引的分片指定坐落在我们之前定义好的 domain1 中的节点上，从而实现一个集群中的子域划分。

现有索引迁移

在进行集群子域划分的过程中，免不了涉及到集群中现有索引的迁移，我这里的迁移方案如下：

先给集群节点加上子域属性进行重启给现有索引添加 setting，设置该属性新添加指定不同子域的节点在新子域创建新索引

以上四个步骤按步骤完成，即可完成集群的改造。相比于将索引直接迁移到新集群，该方式能够降低成本，同时对外无感知，在单个索引影响性能极大的情况下，可以考虑通过这一方案进行解决。

posted @ 2021-01-06 16:26 哆啦梦乐园阅读(938) 评论(0) 编辑收藏举报

刷新页面返回顶部

哆啦梦乐园

…慢慢体味生命中的点点滴滴…