1. 介绍
Lucene是一个用Java写的全文索引引擎工具包,软件包中包括一些简单的例程,可以直接试用。本例将测试对一个目录中的txt文件进行索引,并通过索引找到相应的文件。
2. 原理
反向搜索机制,维护了一个词/短语表,对于这个表中的每个词/短语,都有一个链表描述了有哪些文档包含了这个词/短语。
Lucene 软件包的发布形式是一个 JAR 文件,包说明
org.apache.lucene.analysis 用于分词
org.apache.lucene.index 用于建立索引
org.apache.lucene.search 用于搜索
3. 安装
1) 下载:
http://xiexiejiao.cn/java/lucene-3-0-2-release-download.html
本文以lucene-3.0.3-src.tar.gz为例,在Linux中安装运行
2) 安装相关工具
a) 安装JDK 1.5以上版本
b) 安装Ant工具(Ant是编译Java的工具,与make功能相似)
$ apt-get install ant
3) 安装(参见源码包中BUILD.txt说明)
$ tar xvzf lucene-3.0.3-src.tar.gz
$ cd lucene
$ ant // 此时在build目录下产生jar包
$ ant compile-demo
$ ant jar-demo // 此时在build目录下产生demo的jar包
4) 运行
$ export CLASSPATH=$CLASSPATH:xxx/build/lucene-core-3.0.3-dev.jar:xxx/build/lucene-demos-3.0.3-dev.jar // 设置jar包环境变量
$ java org.apache.lecene.demo.IndexFiles TXT所在的目录名 // 此时生成了索引
$ java org.apache.lecene.demo.SearchFiles //然后按提示输入要查的词,即可找到相应的txt
4. 参考
1) Lucene入门
http://www.iteye.com/topic/33241
(转载请注明出处)