Lucene学习第一天
1.Lucene 的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为各种中小型应用程序加入全文检索功能。2001年年底成为APACHE基金会jakarta的一个子项目。
}Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能 。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。
2.Lucene的优势:
高效-信息检索 (Information Retrieval)
成熟-经过多个项目检验
免费-开源(open-source project in Java)
3.示例简单的标准分词的使用
import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.Token; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.standard.StandardAnalyzer; public class TestLucene { /** * @param args * @throws IOException */ public static void main(String[] args) throws IOException { Analyzer analyzer = new StandardAnalyzer();//创建一个标准的分词器 TokenStream tokenStream = analyzer.tokenStream("",new StringReader("this is a student good boy")); Token token = new Token(); while(tokenStream.next(token)!= null){ System.out.println(token); } } }