上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 41 下一页

2022年1月28日

理解FST

摘要: 其实FST很复杂,不过我们可以简单点理解成HashMap就行了 转载 lucene字典实现原理 - zhanlijun - 博客园 (cnblogs.com) 1 lucene字典 使用lucene进行查询不可避免都会使用到其提供的字典功能,即根据给定的term找到该term所对应的倒排文档id列表 阅读全文

posted @ 2022-01-28 16:20 MaXianZhe 阅读(416) 评论(0) 推荐(0) 编辑

2022年1月26日

ES-段和提交点

摘要: 倒排索引的不可变性,这点主要是因为 Elasticsearch 的底层是基于 Lucene,而在 Lucene 中提出了按段搜索的概念,将一个索引文件拆分为多个子文件,则每个子文件叫作段,每个段都是一个独立的可被搜索的数据集,并且段具有不变性,一旦索引的数据被写入硬盘,就不可再修改。 段 的概念提出 阅读全文

posted @ 2022-01-26 18:03 MaXianZhe 阅读(663) 评论(0) 推荐(0) 编辑

Mapping建模-优化相关

摘要: 尽量避免使用nested或 parent/child,能不用就不用; nested query慢, parent/child query 更慢,比nested query慢上百倍;因此能在mapping设计阶段搞定的(大宽表设计或采用比较smart的数据结构),就不要用父子关系的mapping。 如 阅读全文

posted @ 2022-01-26 15:52 MaXianZhe 阅读(150) 评论(0) 推荐(0) 编辑

ElasticSearch中Filter和Query的异同

摘要: 查询虽然包含这两种,但是查询在不同的执行环境下,操作还是不一样的。 Query与Filter查询在Query查询上下文和Filter过滤器上下文中,执行的操作是不一样的: Query查询上下文: 在查询上下文中,查询会回答这个问题——“这个文档匹不匹配这个查询,它的相关度高么?” 如何验证匹配很好理 阅读全文

posted @ 2022-01-26 11:36 MaXianZhe 阅读(152) 评论(0) 推荐(0) 编辑

2022年1月25日

ES 多重字段

摘要: 处于不同的目的,通过不同的方法索引相同的字段通常非常有用。这也是多字段的目的。例如,一个字符串字段可以映射为text字段用于全文本搜索,也可以映射为keyword字段用于排序或聚合。 PUT my_index { "mappings": { "_doc": { "properties": { "ci 阅读全文

posted @ 2022-01-25 15:51 MaXianZhe 阅读(206) 评论(0) 推荐(0) 编辑

ES选举机制

摘要: Elasticsearch 技术分析(六): 自动发现机制 - Zen Discoveryedit - JaJian - 博客园 (cnblogs.com) 阅读全文

posted @ 2022-01-25 11:19 MaXianZhe 阅读(59) 评论(0) 推荐(0) 编辑

ES配置文件说明(一)

摘要: discovery.zen.ping.unicast.hosts设置应仅包含所有符合主机资格的节点的列表,而不能包含数据节点。 这样,在向外扩展集群并向集群中添加新数据节点时,无需修改所有现有数据节点的配置。 过时配置 配置(新) discovery.zen.ping.unicast.hosts d 阅读全文

posted @ 2022-01-25 11:15 MaXianZhe 阅读(229) 评论(0) 推荐(0) 编辑

ES中各个物理文件的意义

摘要: 先上一张图 以下是引用网上的说法 一份数据写入es会产生多份数据用于不同查询方式,会比原数据占用更多磁盘空间。而索引setting里"codec": "best_compression"是针对_source进行压缩的,压缩算法是deflate压缩比为6。存储原文_source的文件.fdt .fdm 阅读全文

posted @ 2022-01-25 10:23 MaXianZhe 阅读(482) 评论(0) 推荐(0) 编辑

2022年1月24日

ES DSL查询总结

摘要: DSL查询有两种 1 match GET cargo_index-202111/_search { "query": { "match": { "cargoId": 29951002600481 } } } 特点:不支持多字段查询,比如上面的查询只能根据cargoId进行查询 2 bool查询,可以 阅读全文

posted @ 2022-01-24 18:27 MaXianZhe 阅读(276) 评论(0) 推荐(0) 编辑

2022年1月22日

Kafka同步刷盘

摘要: 网上有一种说法,kafka不支持同步刷盘,这种说法也不能说是错的。但是还是可以通过参数的配置变成同步刷盘 log.flush.interval.messages //多少条消息,刷盘1次 默认值 LONG.MAX_VALUE log.flush.interval.ms //割多长时间,刷盘1次 LO 阅读全文

posted @ 2022-01-22 17:00 MaXianZhe 阅读(2116) 评论(0) 推荐(1) 编辑

上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 41 下一页

导航