Lucene 入门需要了解的东西
全文搜索引擎的原理网上大段的内容,要想深入的学习,最好的办法就是先用一下,lucene 发展比较快,下面是写第一个demo 要注意的一些事情:
1、Lucene的核心jar包,下面几个包分别位于不同的文件夹,需要手工找到并引用就可以进行开发了
lucene-core-5.3.1.jar
lucene-analyzers-common-5.3.1.jar
lucene-queryparser-5.3.1.jar
2、主要开发包说明
org.apache.lucene.analysis:语言分析器,主要用于分词
org.apache.lucene.document:索引文档的管理
org.apache.lucene.index:索引管理,如增、删、改
org.apache.lucene.queryparser:查询分析
org.apache.lucene.search:检索管理
org.apache.lucene.store:数据存储管理
org.apache.lucene.util:工具包
3、写入索引操作的核心类
Directory:代表索引文档的存储位置,这是一个抽象类有FSDirectory和RAMDirectory两个主要子类。前者将索引写入文件系统,后者将索引文档写入内存。
Analyzer:建立索引时使用的分析器,主要子类有StandardAnalyzer(一个汉字一个词),还可以由第三方提供如开源社区提供一些中文分词器。
IndexWriterConfig:操作索引库的配置信息
IndexWriter:建立索引的核心类,用来操作索引(增、删、改)
Document:代表一个索引文档
Field:代表索引文档中存储的数据,新版本的Lucene进行了细化给出了多个子类:IntField、LongField、FloatField、DoubleField、TextField、StringField等。
每天进步一点点,有时间先装修空间哈