2024年3月27日

倒排索引

摘要: 倒排索引主要由两部分组成: 1)单词词典,即每个文档进行分词后的词项在去重后组成的集合; 2)倒排文件 是倒排列表持久化存储的结果,通常保存在磁盘等存储设备上。倒排列表记录了词项所在文档的文档列表、单词频率等信息。 我们以4个文档为例: 文档编号 文档内容 1 作为一款领先的聊天助手,ChatGPT 阅读全文

posted @ 2024-03-27 10:54 花阴偷移 阅读(17) 评论(0) 推荐(0) 编辑

导航