lucene随笔

lucene是一个基于java开发的全文检索工具

一.创建全文检索步骤:
    1)创建一个Director对象,指定索引库保存的位置
    2)基于Director对象创建一个IndexWriter对象
    3)读取磁盘上的文件,对应每个文件创建一个文件对象
    4)向文档对象中添加域
    5)把文档对象写进索引库
    6)关闭IndexWriter对象

 

例子:


    

 

二.创建luke步骤:
    1)创建要给Director对象,指定索引库的位置
    2)创建一个IndexReader对象
    3)创建一个IndexSearcher对象.构造方法中的参数IndexSearcher对象
    4)创建一个Query对象,TermQuery
    5)执行查询,得到TopDocs对象
    6)取查询结果的总记录数
    7) 取文档列表
    8) 打印文档中的类容
    9) 关闭IndexReader对象

例子:
 
三.分析器
    IKAnalyzer的使用方法:
        1)IKAnalyzer的jar包添加到工程中
        2)把配置文件和扩展词典添加到工程的classpath下
            注意:扩展词典严禁使用windows记事本编辑保证扩展词典的编码格式是utf-8
            扩展词典:添加一些新词
            停用词词典:无意义的词或者一些敏感词

例子:
 

四.索引查询
    1)使用Query的子类
        1.TermQuery
            根据关键词进行查询
            需要指定要查询的域及要查询的关键词
        2.RangeQuery
            范围查询
    2)使用QueryPaser进行查询
        可以对要查询的内容先分词,然后基于分词的结果进行查询
        添加一个jar包
        lucene-queryparser-7.4.0.jar

posted @ 2018-09-13 00:24  李建琨是谁  阅读(137)  评论(0编辑  收藏  举报