随笔分类 -  Lucene

Lucene
Lucene教程(四) 索引的更新和删除
摘要:这篇文章是基于上一篇文章来写的,使用的是IndexUtil类,下面的例子不在贴出整个类的内容,只贴出具体的方法内容。 3.5版本: 先写了一个check()方法来查看索引文件的变化: /** /** * 检查一下索引文件 * 检查一下索引文件 */ */ public static void che 阅读全文

posted @ 2018-07-24 15:46 范兵 阅读(2665) 评论(0) 推荐(0) 编辑

lucene学习笔记(四)lucene分词详解
摘要:分词器的核心类 Analyzer SimpleAnalyzer StopAnalyzer WhitespaceAnalyzer StandardAnalyzer TokenStream 分词器做好处理之后得到的一个流,这个流中存储了分词的各种信息,可以通过TokenStream有效的获取到分词单元信 阅读全文

posted @ 2018-07-24 15:45 范兵 阅读(313) 评论(0) 推荐(0) 编辑

Lucene的数值索引以及范围查询
摘要:对文本搜索引擎的倒排索引(数据结构和算法)、评分系统、分词系统都清楚掌握之后,本人对数值索引和搜索一直有很大的兴趣,最近对Lucene对数值索引和范围搜索做了些学习,并将主要内容整理如下: 1. Lucene不直接支持数值(以及范围)的搜索,数值必须转换为字符(串); 2. Lucene搜索数值的初 阅读全文

posted @ 2018-07-24 15:44 范兵 阅读(2851) 评论(0) 推荐(1) 编辑

Lucene4:获取中文分词结果,根据文本计算boost
摘要:1. 要求 环境: Lucene 4.1版本/IKAnalyzer 2012 FF版本/mmseg4j 1.9版本 实现功能: 1).给定输入文本,获取中文拆分词结果;2).给定输入文本,对该文本按一定规则进行权重打分;如:文本中包含指定关键词的频率越高,分值越高。 2. 实现代码 输出: 原文:亭 阅读全文

posted @ 2018-07-24 15:44 范兵 阅读(737) 评论(0) 推荐(0) 编辑

Lucene 分页搜索实现
摘要:Lucene中有两种分页查询方式 1、一次查询出大量数据,然后根据页码定位是哪个文档,其实就是暴力获取了 2、通过调用searchAfter来实现 我们都知道collect是lucene中对搜索到的文档进行收集和排序过程,searchAfter也是通过一个收集器来控制的,叫PagingTopScor 阅读全文

posted @ 2018-07-24 15:40 范兵 阅读(1167) 评论(0) 推荐(0) 编辑

Lucene索引的【增、删、改、查】
摘要:前言 搞检索的,应该多少都会了解Lucene一些,它开源而且简单上手,官方API足够编写些小DEMO。并且根据倒排索引,实现快速检索。本文就简单的实现增量添加索引,删除索引,通过关键字查询,以及更新索引等操作。 目前博猪使用的不爽的地方就是,读取文件内容进行全文检索时,需要自己编写读取过程(这个so 阅读全文

posted @ 2018-06-26 14:20 范兵 阅读(289) 评论(0) 推荐(0) 编辑

Lucene--FuzzyQuery与WildCardQuery(通配符)
摘要:FuzzyQuery: 创建索引: 注:IndexWriter中的create的变量值一般设为true 搜索: 模糊搜索的三种构造函数,具体讲一下参数的用法(以第三个为例); 第一个参数当然是词条对象,第二个参数指的是levenshtein算法的最小相似度,第三个参数指的是要有多少个前缀字母完全匹配 阅读全文

posted @ 2018-06-26 14:12 范兵 阅读(3487) 评论(0) 推荐(0) 编辑

IKAnalyzer兼容Lucene 5.4.0版本抛出异常?
摘要:ava.lang.AbstractMethodError: org.apache.lucene.analysis.Analyzer.createComponents(Ljava/lang/String;)Lorg/apache/lucene/analysis/Analyzer$TokenStream 阅读全文

posted @ 2018-06-26 14:12 范兵 阅读(1661) 评论(0) 推荐(1) 编辑

Lucene之模糊、精确、匹配、范围、多条件查询
摘要:Lucene的查询方式很 丰富,对于数值类型的数据,采取TermRangeQuery的方式,对于String类型的,就可以采取TermQuery等,查询方式了,可以通过采取合适的查询方式,检索到数据。Queryparser这个查询方式包含了其他几种查询方式。 查询方式 案例 阅读全文

posted @ 2018-06-26 14:10 范兵 阅读(5829) 评论(0) 推荐(1) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示