Elasticsearch 基本概念
1、Node(节点)(一般每一个节点对应一台服务器)
主节点、数据节点、协调节点、Ingest节点
节点,一个ES实例就是一个node,一个机器可以有多个实例,所以并不是说一台机器就是一个node,大多数情况下,每个node运行在一个独立的环境或者虚拟机上。
2、Shard(分片)
将要建立的索引分片存储
.分片,ES是分布式搜索引擎,每个索引有一个或多个分片,索引的数据被分配到各个分片上,相当于一桶水 用了N个杯子装 2.分片有助于横向扩展,
N个分片会被尽可能平均地(rebalance)分配在不同的节点上(例如你有2个节点,4个主分片(不考虑备份),那么每个节点会分到2个分片,后来你增加了2个节点,
那么你这4个节点上都会有1个分片,这个过程叫relocation,ES感知后自动完成) 3.分片是独立的,对于一个Search Request的行为,每个分片都会执行这个Request.
另外 4.每个分片都是一个Lucene Index,所以一个分片只能存放 Integer.MAX_VALUE - 128 = 2,147,483,519个docs。
3、replica(副本)
实现高可用需要保存的副本数量
副本,可以理解为备份分片上的数据,相应地有primary shard(主分片) ,主分片和备分片不会出现在同一个节点上(防止单点故障),
默认情况下一个索引创建5个分片一个备份(即5primary+5replica=10个分片)
如果你只有一个节点,那么5个replica都无法分配(unassigned),此时cluster status会变成Yellow
4、index 索引
索引,即一系列documents的集合
4、cluster
-
集群,一个ES集群是由多个节点(Node)组成的,每个集群都有一个cluster name 作为标识
-
`cluster.name: 【elastic search cluster name】`在同一网段下的Elastic search实例会通过cluster name 决定加入哪个集群下。参考:
-