01 2010 档案

摘要:如果在初始化一个IndexWriter索引器的时候,指定 useCompoundFile =false,则在指定的索引目录中生成的索引文件就不是.cfs复合索引文件。通过这种方式生成的索引文件,它的不同格式表明了它锁存储的关于索引的不同内容。至少,明确了在建立索引过程中,经过加工处理的数据究竟去向如何,能够加深对Lucene索引过程的理解。通过在文章 Lucene-2.2.0 源代码阅读学习(4)... 阅读全文
posted @ 2010-01-21 19:15 abstractwind 阅读(409) 评论(0) 推荐(0) 编辑
摘要:复合索引文件格式(.cfs)是如何产生的?从这个问题出发,研究索引文件是如何合并的,这都是IndexWriter类中定义的一些重要的方法。在建立索引过程中,生成的索引文件的格式有很多种。在文章 Lucene-2.2.0 源代码阅读学习(4) 中测试的那个例子,没有对IndexWriter进行任何的客户化设置,完全使用Lucene 2.2.0默认的设置(以及,对Field的设置使用了Lucene自带... 阅读全文
posted @ 2010-01-18 19:29 abstractwind 阅读(3572) 评论(0) 推荐(1) 编辑
摘要:阅读了这么多代码,该综合总结一下了。通过在文章 Lucene-2.2.0 源代码阅读学习(4) 中的那个例子,跟踪一下一个IndexWriter索引器实例化过程,及其建立索引的过程中都经过了哪些处理(主要看涉及到了哪些类来完成建立索引的强大功能)。在文章 Lucene-2.2.0 源代码阅读学习(4) 中的主函数如下所示:public static void main(String[] args)... 阅读全文
posted @ 2010-01-11 16:13 abstractwind 阅读(279) 评论(0) 推荐(0) 编辑
摘要:通过对DocumentWriter类的writePostings()方法进行学习。同时,研究并解决几个我一直感到困惑的几个类的用途,以及到底怎样阐述能使自己有一种感性的认识。writePostings()方法的实现writePostings()方法是对已经经过倒排的文档,将词条的一些有用信息写入到索引段文件中。该方法的实现如下所示:private final void writePostings(... 阅读全文
posted @ 2010-01-10 16:10 abstractwind 阅读(356) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示