Elasticsearch7.X ILM索引生命周期管理（冷热分离）

一、“索引生命周期管理”概述

Elasticsearch索引生命周期管理指：Elasticsearch从设置、创建、打开、关闭、删除的全生命周期过程的管理。

二、为什么要使用“索引生命周期管理”

1、ELK集群之前的索引模式，通过app_name和日期区分，随着时间累积，索引数量逐渐增多，造成服务器内存、CPU、IO等指标上涨；

2、需要创建额外定时任务执行索引删除脚本，这种方式无法避免kafka重复消费造成的大量已删除索引重建，并无法用脚本按日期删除；

3、根据日志查询和存储的特点，将数据冷热分离，热数据使用高性能磁盘提高写入与查询效率，温数据只做查询不影响数据写入性能，冷数据用OSS等低价存储作为归档节约存储成本。

三、面临的问题

1、ES生命周期策略要紧密贴合业务模型

2、数据冷热节点和生命周期策略需要合理规划

3、数据高可用性规划(单纯日志场景对数据可用性并不高，可以规划0副本索引，减小系统开销)

四、配置方法及原理

1、生命周期管理的本质--RollOver

当现有索引被认为太大或太旧时，滚动索引API将别名滚动到新索引。该API接受一个别名和一个条件列表。别名必须只指向一个索引。如果索引满足指定条件，则创建一个新索引，并将别名切换到指向新索引的位置

2、使用场景

RollOver适合存放日志数据、索引非常大、索引实时导入数据等场景

在索引模板配置好索引的setting、mapping等参数，然后配置好_rollover规则，es会帮助你处理剩余的事情

索引生命周期管理使用了rollover的特性，将rollover分成四个阶段。

3、四个阶段

ES索引生命周期管理分为4个阶段：hot、warm、cold、delete，其中hot主要负责对索引进行rollover操作，warm、cold、delete分别对rollover后的数据进一步处理

阶段	描述
hot	主要处理时序数据的实时写入
warm	可以用来查询，但是不再写入
cold	索引不再有更新操作，并且查询也会很少
delete	数据将被删除

注意：上述四个阶段不是必须同时存在

4、配置方法

实现索引生命周期，必须同时存在如下要素，缺一不可，上述四个阶段可以根据实际情况配置，并为ES数据节点添加相应的标签。

配置项	描述
节点标签	配置数据节点标签，区分热节点、温节点以及冷节点
生命周期策略	定义热阶段的大小、最大文档数或最大时长，温阶段是否缩小索引、冷阶段存在时长及删除周期
索引模板引用生命周期策略	模板中指定引用的生命周期策略，按模板规则创建索引后，加载生命周期策略
索引模板指定调度节点	将新建索引分片都分配到热节点

4.1、节点

热节点

这种类型的数据节点执行集群内所有的操作，节点存储的数据经常被查询，属于IO、CPU密集型操作，因而需要CPU比较空闲和装有高性能IO读写的磁盘（如SSD）的服务器支撑。

#配置方法
vim /data/app/elasticsearch/config/elasticsearch.yml
 
#每个热节点加入如下配置并重启服务
node.attr.box_type: hot
node.attr.rack: rack1
#这两项配置是为节点增加标签，具体名称并不是写死的，与后面模板和策略配置有关

温节点

这种类型的数据节点处理不太常用的索引（比如前一天的日志数据），这种数据查询的实时性不算高，索引为只读索引，不会有写入操作，因此不需要SSD磁盘存储，降低存储成本。

#配置方法
vim /data/app/elasticsearch/config/elasticsearch.yml
 
#每个温节点加入如下配置并重启服务
node.attr.box_type: warm
node.attr.rack: rack1

冷节点

冷节点数据适合作为归档使用，比温节点查询还要少（比如半月以上的归档日志），这种类型数据一般很少查询，并不会消耗CPU性能及IO，但是存储容量会很大，需要更低成本的存储，例如OSS或S3；ES可以使用经过fuse协议挂载的对象存储作为后端存储。

#配置方法
vim /data/app/elasticsearch/config/elasticsearch.yml
 
#每个温节点加入如下配置并重启服务
node.attr.box_type: cold
node.attr.rack: rack1

4.2、生命周期策略

配置方法：

1、利用Kibana新建策略并指定到模板

打开Kibana--->管理--->索引生命周期策略

创建策略

保存策略并在创建模板后添加到模板中

2、调用ESApi将策略写入ES

curl -XPUT -H "content-type:application/json" http://es_addr:9200/_ilm/policy/test_policy \
 
-d "{
    "policy": {
        "phases": {
            "hot": {
                "min_age": "0ms",
                "actions": {
                    "rollover": {
                        "max_age": "1h",
                        "max_size": "10mb",
                        "max_docs": 50000
                    },
                    "set_priority": {
                        "priority": 100
                    }
                }
            },
            "warm": {
                "min_age": "0ms",
                "actions": {
                    "allocate": {
                        "number_of_replicas": 0,
                        "include": {},
                        "exclude": {},
                        "require": {
                            "box_type": "warm"
                        }
                    },
                    "shrink": {
                        "number_of_shards": 3
                    },
                    "set_priority": {
                        "priority": 50
                    }
                }
            },
            "cold": {
                "min_age": "1h",
                "actions": {
                    "freeze": {},
                    "allocate": {
                        "include": {},
                        "exclude": {},
                        "require": {
                            "box_type": "cold"
                        }
                    },
                    "set_priority": {
                        "priority": 0
                    }
                }
            },
            "delete": {
                "min_age": "2h",
                "actions": {
                    "delete": {}
                }
            }
        }
    }"

4.3、索引模板

以下为索引模板配置，要有以下配置项策略才会生效，其他选项如字段mapping等请参考官方文档

PUT _template/my_template
{
  "index_patterns": ["test-*"], 
  "settings": {
    "number_of_shards": 5,
    "number_of_replicas": 0,
    "index.lifecycle.name": "test_policy", #指定索引生命周期策略名称
    "index.lifecycle.rollover_alias": "test-alias", #指定rollover别名（索引写入与读取时所用的名称）
    "routing.allocation.require.box_type": "hot" #指定索引新建时所分配的节点（此项不指定会默认分配到所有节点）
  }
}

注意：索引创建的名称应该是以 “-00001”等可自增长的字段结尾，否则策略不生效，es指定索引的别名写入

posted @ 2020-07-20 15:22 Mike.老王~ 阅读(6301) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

昵称： Mike.老王~
园龄： 6年11个月
粉丝： 1
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. OpenLDAP 2.4.44 安装部署避坑指南(1)

Mike.老王运维笔记

Elasticsearch7.X ILM索引生命周期管理（冷热分离）

Elasticsearch7.X ILM索引生命周期管理（冷热分离）

一、“索引生命周期管理”概述

二、为什么要使用“索引生命周期管理”

三、面临的问题

四、配置方法及原理

1、生命周期管理的本质--RollOver

2、使用场景

3、四个阶段

4、配置方法

4.1、节点

热节点

温节点

冷节点

4.2、生命周期策略

4.3、索引模板

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论