摘要: 分词器概念介绍: Analyzer类(分词器)就是把一段文本中的词按某些规则取出,提供和以后查询时使用的工具类,注意在创建索引时会用到分词器,在使用字符串搜索时也会用到分词器,这两个地方要使用同一个分词器,否则可能会搜索不出结果 分词器工作流程: 1, 切分关键词 2, 去除停用词 3, 对于英文单 阅读全文
posted @ 2018-12-10 15:50 HelloWord404 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 更新操作如下: 注意:通过lukeall-1.0.0.jar 查看软件,我们可以看到,更新其实是先删除在插入, 前面我们知道索引库中有两部分的内容组成,一个是索引文件,另一个是目录文件, 目前我们更新, 只是真对Document, 但是Term部分并没有同步, 所以等会需要优化索引库即可 注意 : 阅读全文
posted @ 2018-12-10 14:59 HelloWord404 阅读(570) 评论(0) 推荐(0) 编辑