Elasticsearch的倒排索引
正排索引和倒排索引
倒排索引核心组成
单词词典(TermDictionary) 记录所有文档的单词,记录单词到倒排列表的关联关系
单词词典一般比较大,可以通过B+树或者哈希拉链法去实现,以满足高性能的插入与查询
倒排列表(Posting List)-记录单词对应的文档结合,由倒排索引项组成
倒排索引项
文档ID
词频TF - 该单词在文档中出现的次数,用于相关性评分
位置 - 单词在文档中分词的位置,用于语句搜索
偏移 - 记录单词的开始结束位置,实现高亮显示
Elasticsearch的倒排索引
分类:
elk
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!