ES得分

一、概念

1.ES主要用于搜索

2.搜索要把更有相关性的结果展示出来

3.对一个文档评分,相关性越大,评分越高

4.打分的本质是排序

 

二、评分规则

1.ES5之前,默认评分规则是TF-IDF,这是信息检索领域最重要的发明

a.TF(Term Frequency)词频,检索词在一篇文档中出现的频次,检索词个数除以一篇文档总字数,频次越高,得分越高

b.DF (Document Frequency),检索词在所有文档中出现的频次

b.IDF (Inverse Document Frequency)逆向文档率,文档个数除以检索词出现过的文档数,频次越高,得分越低

 

2.ES5开始,默认使用BM25

a.传统的TF数值越大,得分越高

b.BM25在TF的数值大到某一区间,得分会趋近一个值,而不是无限增大

 

三、boost代码控制

1.boost默认值是1

2.boost>1时,打分升高

3.0<boost<1时,打分降低

4.boost<0时,贡献负分

 

 

 

 

参考:

https://www.jianshu.com/p/bd7a09cefe0e

https://www.cnblogs.com/niutao/p/10909302.html

 

posted @ 2022-03-28 11:34  牧云文仔  阅读(427)  评论(0编辑  收藏  举报