摘要: 对于Lucene的索引过程,除了将词(Term)写入倒排表并最终写入Lucene的索引文件外,还包括分词(Analyzer)和合并段(merge segments)的过程,本次不包括这两部分,将在以后的文章中进行分析。 Lucene的索引过程,很多的博客,文章都有介绍,推荐大家上网搜一篇文章:《An 阅读全文
posted @ 2017-11-02 17:27 剑神西门吹雪 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2017-11-02 15:43 剑神西门吹雪 阅读(119) 评论(0) 推荐(0) 编辑
摘要: Lucene总的来说是: 一个高效的,可扩展的,全文检索库。 全部用Java实现,无须配置。 仅支持纯文本文件的索引(Indexing)和搜索(Search)。 不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。 在Lucene in action中,Lucene 的构架和过程如下图, 阅读全文
posted @ 2017-11-02 14:56 剑神西门吹雪 阅读(186) 评论(0) 推荐(0) 编辑
摘要: 一、总论 根据http://lucene.apache.org/java/docs/index.html 定义: Lucene 是一个高效的,基于Java 的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。 那么什么叫做全文检索呢?这要从我们生活中的数据说起。 我们生活中的数据 阅读全文
posted @ 2017-11-02 13:42 剑神西门吹雪 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 1、经典图 阅读全文
posted @ 2017-11-02 13:41 剑神西门吹雪 阅读(85) 评论(0) 推荐(0) 编辑