摘要: 主要介绍近似匹配的常规玩法,以及rescoring优化性能的思路 阅读全文
posted @ 2020-03-22 09:16 清茶豆奶 阅读(612) 评论(0) 推荐(0) 编辑
摘要: 了解一下多字段搜索的场景,和要注意的细节点,精准搜索是一个非常大的话题,优化的空间没有上限,可以先从最基础的场景和调整语法开始尝试。 阅读全文
posted @ 2020-03-22 09:14 清茶豆奶 阅读(2574) 评论(0) 推荐(0) 编辑
摘要: 概要 本篇介绍怎样在全文字段中搜索到最相关的文档,包含手动控制搜索的精准度,搜索条件权重控制。 手动控制搜索的精准度 搜索的两个重要维度:相关性(Relevance)和分析(Analysis)。 相关性是评价查询条件与结果的相关程度,并对相关程度进行排序,一般使用TF/IDF方法。 分析是指将索引文 阅读全文
posted @ 2020-03-03 07:49 清茶豆奶 阅读(838) 评论(2) 推荐(1) 编辑
摘要: 主要介绍shard内部的原理,包含写入、更新删除,translog机制,segment合并等,了解数据库的童鞋对translog机制应该非常熟悉,原理上大同小异,仅作抛砖引玉 阅读全文
posted @ 2020-01-23 08:32 清茶豆奶 阅读(964) 评论(0) 推荐(0) 编辑
摘要: 结构化搜索针对日期、时间、数字等结构化数据的搜索,它们有自己的格式,我们可以对它们进行范围,比较大小等逻辑操作,这些逻辑操作得到的结果非黑即白,要么符合条件在结果集里,要么不符合条件在结果集之外,没有那种相似的概念 阅读全文
posted @ 2020-01-23 08:30 清茶豆奶 阅读(513) 评论(0) 推荐(0) 编辑
摘要: 本篇介绍了零停机索引重建操作的三个方案,从自研功能、scroll+bulk到reindex,我们作为Elasticsearch的使用者,三个方案的参与度是逐渐弱化的,但稳定性却是逐渐上升的,我们需要清楚地去了解各个方案的优劣,适宜的场景,然后根据实际的情况去权衡,哪个方案更适合我们的业务模型,仅供参考,谢谢 阅读全文
posted @ 2020-01-18 10:02 清茶豆奶 阅读(519) 评论(0) 推荐(0) 编辑
摘要: Elasticsearch让索引创建变得非常简单,只要索引一条新的数据,索引会自动创建出来,但随着数据量的增加,我们开始有了索引优化和搜索优化的需求之后,就会发现自动创建的索引在某些方面不能非常完美的适应我们的需求,我们开始考虑手动创建适合我们业务需求的索引 阅读全文
posted @ 2020-01-18 09:34 清茶豆奶 阅读(407) 评论(0) 推荐(0) 编辑
摘要: 主要介绍一下分布式环境中搜索的两阶段执行过程 阅读全文
posted @ 2020-01-18 09:26 清茶豆奶 阅读(2493) 评论(0) 推荐(2) 编辑
摘要: 主要介绍了相关性评分算法的基础知识,能够使用工具查看评分的详细过程,可以辅助解释一些困惑的现象,最后简单介绍了一下正排索引的应用场景 阅读全文
posted @ 2020-01-05 08:24 清茶豆奶 阅读(1021) 评论(0) 推荐(0) 编辑
摘要: 介绍Query DSL的语法及基础实战内容,顺带点了一下filter与query的区别,面对复杂查询语句时,建议先用验证工具进行排查,最后介绍了一下排序方面的知识,基础语法、上机案例多实践即可 阅读全文
posted @ 2020-01-01 15:54 清茶豆奶 阅读(596) 评论(0) 推荐(1) 编辑