倒排索引

倒排索引:
ElasticSearch使用的是一种称为倒排索引的结构,采用Lucene倒排索引作为底层,这种结构适用于快速的全文检索,一个索引由文档中所有不重复的列表构成,对于每一个词,都包含他的文档列表,
列如现在有两个文档,每个文档包含如下内容:

 

 为了创建倒排索引,我们首先要将每个文档拆分成独立的词(或称为词条或者tokens),然后创建一个不包含所有补充度的词条的排序列表,然后列出每个词出现在那个文档

 

 现在,我们视图搜索 to forever,只需要查看包含每个词条的文档

 

 

通过二维表的命中,来决定搜索的结果和权重的高低
两个文档都匹配,但是第一个文档比第二个文档的匹配程度更高,如果没有别的条件,现在这个刘昂个包含关键字的文档都将返回

posted @ 2021-10-20 16:44  贱贱的小帅哥  阅读(58)  评论(0编辑  收藏  举报