huangfox - 博客园

web集群时session同步的3种方法[转]

摘要：在做了web集群后，你肯定会首先考虑session同步问题，因为通过负载均衡后，同一个IP访问同一个页面会被分配到不同的服务器上，如果session不同步的话，一个登录用户，一会是登录状态，一会又不是登录状态。所以本文就根据这种情况给出三种不同的方法来解决这个问题：阅读全文

posted @ 2010-11-03 12:03 huangfox 阅读(6026) 评论(1) 推荐(1) 编辑

lucene3.0_IndexSearcher分页

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总在绝大多数项目中需要分页取出目标结果。lucene当中提供了现成的方法，使用很方便。主要用到的方法（API）：TopDocstopDocs(intstart, inthowMany)Returns the documents in the rage [start ..Returns the documents in the rage [start .. start+howMany) that were collected by this collector. Note that if start >= pq.size(), an emp 阅读全文

posted @ 2010-10-19 13:47 huangfox 阅读(4329) 评论(0) 推荐(0) 编辑

lucene3.0_QueryParser的语法

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总Query有很多子类，完成不同类型的查询任务：Instantiable subclasses are:TermQueryMultiTermQueryBooleanQueryWildcardQueryPhraseQueryPrefixQueryMultiPhraseQueryFuzzyQueryTermRangeQueryNumericRangeQuerySpanQuery不过使用我们系统的用户可并不乐意去了解这些看上去复杂的东西。那么我们希望有一个工具——他能够理解用户的搜索意图，然后转换成lucene中合理的Query子类，提供给lucen 阅读全文

posted @ 2010-10-19 10:32 huangfox 阅读(5934) 评论(0) 推荐(0) 编辑

lucene3.0_multiSearcher的应用

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总有的项目需要将不同的数据放到不同的索引当中，有时为了避免单个索引文件过大而对其进行分割（形成多个独立的索引）......又由于各种需求需要在多个索引中进行检索，因此就有了lucene中的multiSearcher。Constructor SummaryMultiSearcher(Searchable...searchables)Creates a searcher which searchessearchers.从api当中还可知MultiSearcher有一个子类：ParalleMultiSearcherConstructor Summar 阅读全文

posted @ 2010-10-19 10:13 huangfox 阅读(2414) 评论(3) 推荐(0) 编辑

lucene3.0_IndexSearcher过滤

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总lucene中的过滤行为将带有过滤行为的检索分成三个过程：过程1：根据用户指定的检索式获得初步目标结果；过程2：根据指定的条件（可以是检索式）获得过滤器，简单理解过滤器——即哪些文档必须从初步目标结果中kill掉。过程3：将初步目标结果“通过”过滤器的“校验”，获得最终的目标结果。上面三个步骤是一种最基础的过滤行为，用实例简单演示一下：正常检索结果（不适用过滤器，将所有文档打印出来）：Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeH 阅读全文

posted @ 2010-10-18 17:23 huangfox 阅读(1434) 评论(0) 推荐(0) 编辑

lucene3.0_IndexSearcher排序

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总IndexSearcher排序本文主要讲解：1.IndexSearcher中和排序相关的方法及sort类、SortField类（api级别）；2.按文档得分进行排序；3.按文档内部id进行排序；4.数值型、日期型排序注意事项；5.多Field排序；6.通过改变boost值来改变文档的得分。----------------------------------------------------------------------1.IndexSearcher中和排序相关的方法及sort类、SortField类（api级别）；用IndexSear 阅读全文

posted @ 2010-10-18 15:04 huangfox 阅读(2361) 评论(0) 推荐(0) 编辑

[ lucene FAQ ] 如何避免lucene queryparser中文分词的缺陷？[转]

摘要：很多人在使用lucene时会使用其提供的queryparser分析query。不过，lucene的queryparser从一开始到现在都没有充分考虑中文等语言的特点，使得查询中文会出现让人不可理解的查不到结果的情况。这个bug就是LUCENE-2458。这个问题简单说来就是，对于一个连续的中文query，queryparser将Analyzer返回的Term序列构成了PhraseQuery（也有可能是MultiPhraseQuery），而PhraseQuery默认的匹配规则是要求Term序列在索引的文档中完全顺序匹配。这对于英文查询来说是可以接受的，因为queryparser在分析query时阅读全文

posted @ 2010-10-18 14:17 huangfox 阅读(2384) 评论(0) 推荐(0) 编辑

lucene3.0_IndexWriter中的commit、rollback和close

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总IndexWriter中的commit、rollback和close基础介绍（api级别）Commit：Commits all pending changes (added & deleted documents, optimizations, segment merges, added indexes, etc.) to the index, and syncs all referenced index files, such that a reader will see the changes and the index upda 阅读全文

posted @ 2010-10-18 11:30 huangfox 阅读(5873) 评论(2) 推荐(1) 编辑

lucene3.0_IndexSearcher的基础使用及注意事项

摘要：较之lucene2.4版本，lucene3.0在indexSearcher这块变动比较大，从api可以直观的了解到。基类Searcher与搜索有关的方法：voidsearch(Queryquery,Collectorresults)Lower-level search API.voidsearch(Queryquery,Filterfilter,Collectorresults)Lower-level search API.TopDocssearch(Queryquery,Filterfilter, intn)Finds the topnhits forquery, applyingfilte 阅读全文

posted @ 2010-10-16 15:25 huangfox 阅读(12452) 评论(0) 推荐(1) 编辑

lucene3.0_和IndexWriter有关的几个参数设置及重建索引注意事项

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总part1:本文介绍和IndexWriter有关的3个参数：1.MAXBufferedDocsMaxBufferedDocs这个参数默认是disabled的，因为Lucene中还用另外一个参数（RAMBufferSizeMB）控制这个bufffer的索引文档个数。其实MaxBufferedDocs和RAMBufferSizeMB这两个参数是可以一起使用的，一起使用时只要有一个触发条件满足就写入硬盘，生成一个新的索引segment文件。2.RAMBufferSize控制用于buffer索引文档的内存上限，如果buffer的索引文档个数到达该上限阅读全文

posted @ 2010-10-16 14:25 huangfox 阅读(6026) 评论(0) 推荐(0) 编辑

lucene3.x_基础使用及注意事项汇总[更新中]

摘要：结合常见的场景，对lucene3.0中的常见api进行讲解，并结合实际应用对一些问题进行分析。阅读全文

posted @ 2010-10-15 16:52 huangfox 阅读(1658) 评论(4) 推荐(0) 编辑

lucene3.0_IndexWriter基础使用及注意事项

摘要：系列汇总：lucene3.0_基础使用及注意事项汇总-------------------------------------------------在指定磁盘下建立索引，并对该过程中存在的问题进行说明：源代码如下所示：Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/-->publicvoid createIndex(){ IndexWriter writer =null ; FSDirectory dir =null ; ... 阅读全文

posted @ 2010-10-15 16:48 huangfox 阅读(8704) 评论(2) 推荐(1) 编辑

[ lucene高级 ] 研讨如何进行Lucene的分布式应用 [转]

摘要： Lucene是个高度优化的倒转索引搜索引擎。它将倒转的索引存储在定制的文件格式中，文件格式被高度优化以确保能被搜索器快速的加载以及有效的搜索。Lucene产生这些结构以致索引几乎完全的被预先计算好Lucene 通过使用Directory接口的实现来存储索引,注意不要将Directory与java.io混淆了.FSDirectory 是Directory接口的一个标准的实现,它将索引保存在文件系统中.还有一些其他的实现,比如有的实现将索引切分小的数据块保存在文件系统中,有的通过使用Map Reduce(见google)的集群来分布索引.还有一种数据库的实现,它将索引作为数据块保存在数据库中(Lu 阅读全文

posted @ 2010-10-15 14:43 huangfox 阅读(7841) 评论(7) 推荐(2) 编辑

[ lucene FAQ ] IndexSearcher初始化，IndexSearcher(Directory dir)和IndexSearcher(IndexReader reader)有什么区别？到底使用那个更合理？

摘要： lucene问题汇总：Lucene常见问题汇总IndexSearcher的构造方法如下：Constructor SummaryIndexSearcher(Directorypath)Creates a searcher searching the index in the named directory, with readOnly=trueIndexSearcher(Directorypath, booleanreadOnly)Creates a searcher searching the index in the named directory.IndexS... 阅读全文

posted @ 2010-10-14 14:21 huangfox 阅读(5187) 评论(0) 推荐(0) 编辑

[ lucene FAQ ] Lucene常见问题汇总[更新中]

摘要：转载请注明出处：author：huangfoxhttp://www.cnblogs.com/huangfox/archive/2010/10/14/1851190.html 请输入标Lucene删除文档，使用IndexReader还是IndexWriter？当磁盘索引被IndexSearcher打开时，为什么优化操作后索引容量翻倍？检索结果怎么排序？对于不同类型（例如int型）的字段排序有什么区别吗？IndexSearcher初始化，IndexSearcher(Directory dir)和IndexSearcher(IndexReader reader)有什么区别？到底使用那个更合理？如何避阅读全文

posted @ 2010-10-14 13:53 huangfox 阅读(1005) 评论(0) 推荐(0) 编辑