ES得分
一、概念
1.ES主要用于搜索
2.搜索要把更有相关性的结果展示出来
3.对一个文档评分,相关性越大,评分越高
4.打分的本质是排序
二、评分规则
1.ES5之前,默认评分规则是TF-IDF,这是信息检索领域最重要的发明
a.TF(Term Frequency)词频,检索词在一篇文档中出现的频次,检索词个数除以一篇文档总字数,频次越高,得分越高
b.DF (Document Frequency),检索词在所有文档中出现的频次
b.IDF (Inverse Document Frequency)逆向文档率,文档个数除以检索词出现过的文档数,频次越高,得分越低
2.ES5开始,默认使用BM25
a.传统的TF数值越大,得分越高
b.BM25在TF的数值大到某一区间,得分会趋近一个值,而不是无限增大
三、boost代码控制
1.boost默认值是1
2.boost>1时,打分升高
3.0<boost<1时,打分降低
4.boost<0时,贡献负分
参考:
https://www.jianshu.com/p/bd7a09cefe0e
https://www.cnblogs.com/niutao/p/10909302.html