摘要: 比如有两条记录Document0: id:1 pk content :hello Document1: id :1 pk content :hello world建立索引用ik分词,建立索引 搜索content 会出现两条记录解决:使用 QueryFilter进行搜索过滤 Query query = 阅读全文
posted @ 2017-05-09 22:53 王南辉 阅读(697) 评论(0) 推荐(0) 编辑
摘要: lucene同义词搜索原理其实是根据 PositionIncrementAttribute 和 CharTermAttribute的次元记录信息来实现的,当前使用lucene版本为4.8.0首先同义词要实现 package lucene_index; import java.io.IOExcepti 阅读全文
posted @ 2017-05-09 22:51 王南辉 阅读(1874) 评论(0) 推荐(0) 编辑
摘要: 转自 http://www.codeceo.com/article/lucene-index.html 1 数值数据类型索引优化 1.1 数值类型索引问题 lucene本质上是一个全文检索引擎而非传统的数据库系统,它基于倒排索引,非常适合处理文本,而处理数值类型却不是强项。 举个应用场景,假设我们倒 阅读全文
posted @ 2017-05-09 22:49 王南辉 阅读(341) 评论(0) 推荐(0) 编辑
摘要: master的工作 对于ReplicationHandler的复制功能来说,核心的问题确定是在一个时间点要复制哪些文件,这就用上了lucene的IndexDeletionPolicy的特性。 lucene在初始化时,会调用IndexDeletionPolicy.onInit(List commits 阅读全文
posted @ 2017-05-09 22:47 王南辉 阅读(960) 评论(0) 推荐(0) 编辑