摘要: http://zhongl.iteye.com/blog/291127引言目前最新的Lucene的版本是2.4.0,但关于索引文件格式(Index File Format)的说明并未完全及时更新,所以后文是基于版本2.1.0展开的解析。解析内容并未涉及全面,更多详细准确的说明还请参见[1]。在看下文之前,若熟悉Lucene的索引的基本概念和过程就会对后文的理解有很大帮助。创建一个简单的索引这里有一段代码,它将创建一个简单的索引段(Segment),这个段只有一个文档(Document),文档中有两个域(Field):name和description。两个域均进行索引(Index)并保存(Sto 阅读全文
posted @ 2012-09-27 16:34 balaamwe 阅读(787) 评论(0) 推荐(0) 编辑
摘要: 转自:http://dev.csdn.net/author/kingjIang/28cf4f5f62ca4bb696c43d5c438e79f7.htmlLucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的关键词,通常我们需要如下处理措施 a.我们... 阅读全文
posted @ 2012-09-27 15:43 balaamwe 阅读(3277) 评论(0) 推荐(1) 编辑