查询过程
读操作步骤(根据文档id查询):
- 客户端发送Get请求到NODE1。
- NODE1使用文档的_id决定文档属于shard0。shard0的所有分片位于所有3个节点上。这次,它将请求路由至NODE2。
- NODE2将文档返回给NODE1,NODE1将文档返回给客户端。
ES读数据底层原理:
- 客户端发送请求至对应文档的shard。
- 先在filesystem cache中进行获取。
- 如果不存在,再到对应segment的磁盘文件中寻找。
- 找到之后,数据缓存进filesystem cache。
- 通过shard返回给客户端。
对于读请求,请求节点(NODE1)将在每次请求到来时都选择一个不同的replica shard来达到负载均衡。使用轮询策略轮询所有的replica shards。 读请求可以从 primary shard 或 replica shard 读取,采用的是随机轮询算法。 写请求是写入 primary shard,然后同步给所有的 replica shard。