work hard work smart

专注于Java后端开发。 不断总结,举一反三。
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

分布式搜索引擎ElasticSearch介绍

Posted on 2020-04-24 21:40  work hard work smart  阅读(304)  评论(0编辑  收藏  举报

1、Lucene, Solr, ElasticSearch的关系

Lucene是类库(Java开发)

Solr基于lucene(Java开发)

ES基于lucene (支持PB级别的查询 PB=1024T)

 

2、ES核心术语与数据库的对应

ES核心术语                       数据库

索引index                           表

类型type(7.3版本弃用)      表逻辑类型

文档document      行

字段 fields       列 

映射mapping      表结构定义

近实时NRT(1秒左右)       Near real time(近实时的搜索)

节点node          每一个服务器

shared replica      数据备份和分片

 

3、集群相关
分片(shard):把索引库拆分为多份,分别放在不同的节点上,比如有3个节点,3个节点的所有数据内容加在一起是一个完整的索引库。分别保存到三个节点上
水平扩展,提高吞吐量。
备份(replica):每个shard的备份。
简称
shard = primary shard(主分片)
replica = replica shard(备份节点)
 
ES集群架构原理

 

 

4、倒排索引

倒排索引源于实际应用中需要根据属性的值来查记录。这种索引表中的每一项都包含一个属性值和包含该属性值的各个记录地址。由于不是根据记录来确定属性,

而是根据属性来确定记录的位置,所有称之为倒排索引。