文章分类 -  elasticsearch

摘要:1、描述 描述:多shard场景下,relevance score经常会出现不准确的问题? 揭秘: (a)、在某个shard中,有很多个document,包含了term下含有的query word。 (b)、搜索请求到达该shard时,计算relevance score(IF/IDF算法) 1、qu 阅读全文
posted @ 2018-05-25 16:30 xylfjk 阅读(44) 评论(0) 推荐(0) 编辑
摘要:1、名词解释 a)、document:ES是面向文档的,存储在ES中的一条是数据即是,一个文档,类似数据库的一条数据。ES会索引每个文档的内容,以便于搜索 b)、bitset:是一个二进制集合里面只有1和0,它表示数据状态的一个列表,每个位置非0即1。如果文档匹配了一个filter,则在bitset 阅读全文
posted @ 2018-05-25 14:50 xylfjk 阅读(291) 评论(0) 推荐(0) 编辑
摘要:constant_score 1、解释 当我们不关心检索词TF(Term Frequency)对搜索结果排序的影响时使用,其查询结果不受TF/IDF的影响 检索词频率:检索词在该字段出现的频率,出现频率越高,相关性也就越高。TF会影响返回结果的排序。 举例:我们搜索酒店,肯定有很多酒店评分比较高,或 阅读全文
posted @ 2018-05-23 11:46 xylfjk 阅读(43) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示