Elasticsearch的倒排索引

正排索引和倒排索引

 倒排索引核心组成

单词词典(TermDictionary) 记录所有文档的单词,记录单词到倒排列表的关联关系

  单词词典一般比较大,可以通过B+树或者哈希拉链法去实现,以满足高性能的插入与查询

倒排列表(Posting List)-记录单词对应的文档结合,由倒排索引项组成

  倒排索引项

    文档ID

    词频TF - 该单词在文档中出现的次数,用于相关性评分

    位置 - 单词在文档中分词的位置,用于语句搜索

    偏移 - 记录单词的开始结束位置,实现高亮显示

Elasticsearch的倒排索引

 

 

posted @   fat_girl_spring  阅读(188)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示