随笔分类 -  Lucene

1 2 下一页

Lucene add、updateDocument添加、更新与search查询(转)
摘要:package com.lucene;import java.io.IOException;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;i... 阅读全文

posted @ 2015-12-10 20:07 1130136248 阅读(2582) 评论(1) 推荐(0) 编辑

Lucene 简单手记http://www.cnblogs.com/hoojo/archive/2012/09/05/2671678.html
摘要:什么是全文检索与全文检索系统?全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全 文检索的方法主要分为按... 阅读全文

posted @ 2015-12-10 16:42 1130136248 阅读(227) 评论(0) 推荐(0) 编辑

Lucene中的合并因子mergeFactor
摘要:mergeFactor是用来决定segment该如何被addDocument()方法进行合并的。当mergeFactor取比较小的值时,索引时所使用的内存较少而且搜素未优化的速度会比较快。因此,mergeFactor取值较大时(比如大于10),适合于批量的索引建立,而当搜索未优化索引的速度会更快,但... 阅读全文

posted @ 2015-12-10 16:38 1130136248 阅读(786) 评论(0) 推荐(0) 编辑

lucene索引合并与增量索引
摘要:利用 Lucene,在创建索引的工程中你可以充分利用机器的硬件资源来提高索引的效率。当你需要索引大量的文件时,你会注意到索引过程的瓶颈是在往磁盘上写索引文件的过程中。为了解决这个问题, Lucene 在内存中持有一块缓冲区。但我们如何控制 Lucene 的缓冲区呢?幸运的是,Lucene 的类 In... 阅读全文

posted @ 2015-12-10 16:09 1130136248 阅读(716) 评论(0) 推荐(0) 编辑

Lucene全文搜索 分组,精确查找,模糊查找
摘要:http://zm603380946.iteye.com/blog/1827318完全个人理解,如有更好的方法,欢迎一起讨论 LuceneUtils.javapackage com.zbiti.lucene;import java.io.File;import java.io.IOException... 阅读全文

posted @ 2015-12-10 12:05 1130136248 阅读(1175) 评论(0) 推荐(0) 编辑

lucene3.6.1 经典案例 入门教程 (包含从文件中读取content)
摘要:转载http://liqita.iteye.com/blog/1676664第一步:下载lucene的核心包lucene-core-3.6.1-javadoc.jar (3.5 MB)lucene-core-3.6.1.jar (1.5 MB)拷贝到项目的lib 文件夹里第二步:在C盘下建立sour... 阅读全文

posted @ 2015-12-10 11:51 1130136248 阅读(216) 评论(0) 推荐(0) 编辑

lucene特殊字符处理
摘要:这是个郁闷的问题,今天遇到了,但在lucene中查询的关键字保护有特殊字符,譬如--,会出现如下异常: org.apache.lucene.queryParser.ParseException: Cannot parse '': Encountered " " at line 1, column 0... 阅读全文

posted @ 2015-12-10 11:31 1130136248 阅读(870) 评论(0) 推荐(0) 编辑

http://www.iteye.com/job/topic/1133159
摘要:Lucene 的索引体系是一个写独占,读共享的结构,这意味着,我们在使用多线程进行添加索引时,性能并不会得到明显的提升,所以任何时刻只能有一个线程对索引进行写 入操作,而保障这个操作的安全性则是来自于,Lucene独特的锁机制(写入操作进行时,我们可以在Lucene的索引根目录里看到一个命名为 wr... 阅读全文

posted @ 2015-12-10 11:28 1130136248 阅读(253) 评论(0) 推荐(0) 编辑

org.apache.lucene.queryParser.ParseException: Encountered "<EOF>" at line 1, column 0.
摘要:如果出现了下列错误,那是因为用错了函数。把queryParser.Query改称queryParser.parse就通过了org.apache.lucene.queryParser.ParseException: Encountered "" at line 1, column 0.Was expe... 阅读全文

posted @ 2015-12-10 11:23 1130136248 阅读(4445) 评论(0) 推荐(0) 编辑

lucene 查询 (转载)
摘要:原网址:http://hi.baidu.com/lszhuhaichao/blog/item/ccffc7cb858f1514bf09e66f.html Lucene3.0之查询处理(1):原理2010-03-06 23:37Lucene3.0之查询处理(1):原理1、 查询的三种方式① 顺序查询:... 阅读全文

posted @ 2015-12-10 10:19 1130136248 阅读(207) 评论(0) 推荐(0) 编辑

Lucene + Hadoop 分布式搜索运行框架 Nut 1.0a9转自http://www.linuxidc.com/Linux/2012-02/53113.htm
摘要:1、概述不管程序性能有多高,机器处理能力有多强,都会有其极限。能够快速方便的横向与纵向扩展是Nut设计最重要的原则,以此原则形成以分布式并行计算为核心的架构设计。以分布式并行计算为核心的架构设计是Nut区别于Solr、Katta的地方。Nut是一个Lucene+Hadoop分布式并行计算搜索框架,能... 阅读全文

posted @ 2015-12-09 22:41 1130136248 阅读(167) 评论(0) 推荐(0) 编辑

Lucene4.X 高级应用
摘要:Lucene 简介以及使用Lucene, 一个基于 Java 的开源的全文搜索工具包,可以方便的嵌入到各种应用系统中,实现针对应用的全文索引以及检索功能。目前是 Apache jakarta 项目组的一个子项目,它的目的是为程序员提供工具包,让程序员利用工具包里的强大接口来完成全文检索。下面我们将以... 阅读全文

posted @ 2015-12-09 22:28 1130136248 阅读(205) 评论(0) 推荐(0) 编辑

lucene中Field.Index,Field.Store的一些设置
摘要:lucene在doc.add(new Field("content",curArt.getContent(),Field.Store.NO,Field.Index.TOKENIZED));Field有两个属性可选:存储和索引。通过存储属性你可以控制是否对这个Field进行存储;通过索引属性你可以控制... 阅读全文

posted @ 2015-12-09 22:22 1130136248 阅读(2773) 评论(0) 推荐(1) 编辑

lucene的两种分页操作
摘要:基于lucene的分页有两种: lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。 lucene3.5以后提供一个searchAfter,这个是在特大数据量采用... 阅读全文

posted @ 2015-12-09 22:03 1130136248 阅读(591) 评论(0) 推荐(0) 编辑

lucene4.7 分页
摘要:转载自http://my.oschina.net/MrMichael/blog/220782我 们先来看下下面的问题,现在我们的索引里有2亿多的数据,那么现在的需求是,把索引里的全部数据,读取然后写入txt文本里,对于这么一个量级的数据,显 然是不可能一下子全部读取完的,那得要多大的内存才能够支持下... 阅读全文

posted @ 2015-12-09 19:58 1130136248 阅读(979) 评论(0) 推荐(0) 编辑

lucene4.7学习总结
摘要:转载自http://blog.csdn.net/mdcmy/article/details/38167955?utm_source=tuicool&utm_medium=referral lucene4.7学习总结 花了一段时间学习lucene今天有时间把所学的写下来,网上有很多文章但大部分都是2... 阅读全文

posted @ 2015-12-09 17:14 1130136248 阅读(236) 评论(0) 推荐(0) 编辑

lucene的多种搜索2-SpanQuery
摘要:SpanQuery按照词在文章中的距离或者查询几个相邻词的查询SpanQuery包括以下几种:SpanTermQuery:词距查询的基础,结果和TermQuery相似,只不过是增加了查询结果中单词的距离信息。SpanFirstQuery:在指定距离可以找到第一个单词的查询。SpanNearQuery... 阅读全文

posted @ 2015-12-08 21:43 1130136248 阅读(244) 评论(0) 推荐(0) 编辑

lucene-SpanQuery跨度查询基础
摘要:1、跨度查询SpanQuery5个子类SpanQuery类型 描述SpanTermQuery和其他跨度查询结合使用,单独使用相当于TermQuerySpanFirstQuery 用来匹配域中的第一个部分内的各个spansSpanNearQuery 用来匹配临近的spansSpanNotQuery 用... 阅读全文

posted @ 2015-12-08 21:31 1130136248 阅读(1192) 评论(0) 推荐(0) 编辑

Lucene中的 Query对象
摘要:"Lucene中的 Query对象":检 索前,需要对检索字符串进行分析,这是由queryparser来完成的。为了保证查询的正确性,最好用创建索引文件时同样的分析器。 queryparser解析字符串时,可以指定查询域,实际可以在字符串中指定一个或多个域。例如:“info:电视台 and id:3... 阅读全文

posted @ 2015-12-08 21:30 1130136248 阅读(981) 评论(0) 推荐(0) 编辑

lucene-SpanFirstQuery 和SpanNearQuery 跨度查询
摘要:1、SpanFirstQuery查询对出现在一个域中前n个位置的跨度查询。public void testSpanFirstQuery() throws Exception{ SpanzFirtsQuery sfq=new SpanFirstQuery(brown,2); assertNoMatch... 阅读全文

posted @ 2015-12-08 21:29 1130136248 阅读(1295) 评论(0) 推荐(0) 编辑

1 2 下一页
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示