常用优化
摘要:存储设备 磁盘在现代服务器上通常都是瓶颈。Elasticsearch 重度使用磁盘,你的磁盘能处理的吞吐量越大,你的节点就越稳定。 这里有一些优化磁盘 I/O 的技巧: 使用 SSD。他们比机械磁盘优秀多了。 使用 RAID 0。条带化 RAID 会提高磁盘 I/O,代价显然就是当一块硬盘故障时整个
阅读全文
posted @
2023-04-06 21:53
zhengbiyu
阅读(13)
推荐(0) 编辑
查询过程
摘要:读操作步骤(根据文档id查询): 客户端发送Get请求到NODE1。 NODE1使用文档的_id决定文档属于shard0。shard0的所有分片位于所有3个节点上。这次,它将请求路由至NODE2。 NODE2将文档返回给NODE1,NODE1将文档返回给客户端。 ES读数据底层原理: 客户端发送请求
阅读全文
posted @
2023-03-30 00:17
zhengbiyu
阅读(15)
推荐(0) 编辑
分析器
摘要:分析 包含下面的过程: 首先,将一块文本分成适合于倒排索引的独立的 词条 , 之后,将这些词条统一化为标准格式以提高它们的“可搜索性”,或者 recall 分析器执行上面的工作。 分析器 实际上是将三个功能封装到了一个包里: 字符过滤器 首先,字符串按顺序通过每个 字符过滤器 。他们的任务是在分词前
阅读全文
posted @
2023-03-29 19:38
zhengbiyu
阅读(44)
推荐(0) 编辑
倒排索引
摘要:正排索引:key-value 中,通过 key 去寻找 value。 倒排索引:通过 value(或包含 value)去寻找对应的 key。 正排索引需要首先对全局进行扫描遍历,进而从中做筛选;而倒排索引可以仅抽取符合条件的 value 值,节省大量的资源。 每个被索引的字段都有自己的倒排索引,是否
阅读全文
posted @
2023-03-29 19:37
zhengbiyu
阅读(47)
推荐(0) 编辑
ES索引字段主要属性配置
摘要:index属性 analyzed:分词后索引,可搜索。 not_analyzed:字段值不分词,以单个关键词进行索引。 no:字段不索引,当然也就不能搜索。 store属性 属性store默认false,当某个数据字段很大,我们可以指定其它字段store为true,这样就不用从_source中取数据
阅读全文
posted @
2023-03-29 19:36
zhengbiyu
阅读(240)
推荐(0) 编辑