摘要:
Lucene是一个基于Java的全文索引工具包。基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展从Lucene我们还可以学到什么另外,如果是在选择全文引擎,现在也许是试试Sphinx的时候了:相比Lucene速度更快,有中文分词的支持,而且内置了对简单的分布式检索的支持;基于Java的全文索引/检索引擎——LuceneLucene不是一个完整的全 阅读全文
摘要:
Lucene简介Lucene是一个基于Java的、高性能的全文检索工具包,它目前是著名的Apache Jakarta家族中的一个开源项目,也是目前最为流行的基于Java开源全文检索工具包。但它不是一个完整的搜索应用程序,而是为应用程序提供索引和搜索功能。Lucene是为文本类型的数据建立索引的,所以只要能把需要索引的数据格式转化的文本的,Lucene就能对文档进行索引和搜索。比如HTML、PDF,都可以转换文本再交给Lucene进行索引。1. Lucene环境1.1 Lucene版本当前版本:取当前最新版本Lucene Core3.4.0下载地址:http://lucene.apache.or 阅读全文