随笔分类 -  lucene入门教程

摘要:前提:本章节使用lucene5.3.0版本,luke也是此版本的。 1.1 生成索引 1.1 生成索引 橙色标注部分的SmartChineseAnalyzer 是中文的分词器,这样当执行main方法后生成的索引文件内容如下图:可见,中文词语已经被分组了。 1.2 中文查询,并高亮显示摘要 1.2 中 阅读全文
posted @ 2017-12-01 14:30 shyroke、 阅读(3532) 评论(0) 推荐(0) 编辑
摘要:本章使用的是lucene5.3.0 指定数字范围查询 结果: 解析:newIntRange("id", 1, 2, true, true); 该方法查询出id值为1和2之间的document,且包含1和2.因为desc设置为“Field.Store.NO”所以这里的值为null 指定字符串开头搜索 阅读全文
posted @ 2017-11-30 19:05 shyroke、 阅读(1791) 评论(0) 推荐(0) 编辑
摘要:需求:模糊搜索。 前提: 本例中使用lucene 5.3.0 这个类用来遍历数据文件夹,生成索引文件。 对特定项搜索 对特定项搜索 注意:上述代码中的橙色标注代码,一定要把IndexWriter实例关闭,否则segments_1文件不会生成。 结果: 解析:对特定项搜索的方法是以搜索关键字作为单位查 阅读全文
posted @ 2017-11-30 17:04 shyroke、 阅读(1512) 评论(0) 推荐(0) 编辑
摘要:一、前言 1.1 应用场景 有时在搜索的时候,会根据需要的不同,对不同的关键值或者不同的关键索引分配不同的权值,让权值高的内容更容易被用户搜索出来,而且排在前面。 为索引域添加权是再创建索引之前,把索引域的权值设置好,这样,在进行搜索时,lucene会对文档进行评分,这个评分机制是跟权值有关的,而且 阅读全文
posted @ 2017-11-29 22:39 shyroke、 阅读(680) 评论(0) 推荐(0) 编辑
摘要:启动luke命令行下图错误 错误原因:luke版本和lucene版本不匹配,lucene5.3.0版本必须用luke5.3.0版本才能打开索引。 解决方法:更新luke版本即可。 luke 所有版本下载地址: https://github.com/DmitryKey/luke/releases 阅读全文
posted @ 2017-11-27 22:37 shyroke、 阅读(243) 评论(0) 推荐(0) 编辑
摘要:一、demo 本例中采用单元测试,故在pom.xml中引入junit jar包 1.1 前提: 1.2 测试写入 1.2 测试写入 结果: 使用luke查看索引文件 使用luke查看索引文件 1.3 测试读取 由于进行了1.2 测试写入,所以要把索引文件清理一下,因为此步骤也会产生索引文件 结果: 阅读全文
posted @ 2017-11-27 21:04 shyroke、 阅读(1140) 评论(0) 推荐(1) 编辑
摘要:前提:在使用lucene进行搜索的时候,必须先生成索引文件,即必须先进行上一章节的案例,生成索引文件如下: 前提:在使用lucene进行搜索的时候,必须先生成索引文件,即必须先进行上一章节的案例,生成索引文件如下: 该索引文件为"segments"开头,如果没有该文件则说明没有索引文件则报错:org 阅读全文
posted @ 2017-11-27 17:40 shyroke、 阅读(1370) 评论(0) 推荐(0) 编辑
摘要:一、百度百科 Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供 阅读全文
posted @ 2017-11-26 23:21 shyroke、 阅读(630) 评论(0) 推荐(0) 编辑

作者:shyroke 博客地址:http://www.cnblogs.com/shyroke/ 转载注明来源~