07 2008 档案
Lucene:(一)建立索引文件:2。建立索引文件(六)--Lucene中Term的索引
摘要:写term索引文件: 介绍完Lucene中term的概念,现在我们开始重新回到正体,建立索引数据库的term信息。 在介绍DocumentWriter类的时候,已经是用分词器将term提取了出来,并进行了排序,最后写了term的两个文件,frq(term频数)和prx(term位置)。接着,DocumentWriter类就要是用别的类来继续索引的建立了。 TermInfosWriter: Te...
阅读全文
Lucene:(一)建立索引文件:2。建立索引文件(五)--Lucene中Term的概念
摘要:Term索引信息: DocumentWriter类写Field信息和Term信息。Field索引信息是调用FieldInfos和FieldWriter两个类完成的,这在上一节已经描述。Term索引信息则由DocumentWriter类和其他类共同完成。DoucmentWriter类完成了term的频数和位置信息。现在接着DocumentWriter写term信息这条线,继续索引信息的建立。 1...
阅读全文
Lucene:(一)建立索引文件:2。建立索引文件(四)--Field信息的建立
摘要:Field信息: 在DocumentWriter类中曾经描述,DocumentWriter类的一个功能是调用与 Field相关的类,写Field信息。写Field信息有两个类FieldInfos类和FieldWriter类,前者是用于写Field name信息,后者写Field value信息。 1.Field name信息: Field name信息是用FieldInfo结构体表示,即Fie...
阅读全文
Lucene:(一)建立索引文件:2。建立索引文件(三)--DocumentWriter类
摘要:在随笔“Lucene:(一)建立索引文件:2。建立索引文件(一)”中提到,写索引文件从IndexWriter类开始;而IndexWriter类写索引可以看成两个方面,其中之一为IndexWriter使用SegmentInfos类写segment文件(上文介绍),另一个就是调用DocumentWriter完成写索引文件的余下工作。 DocumentWriter类也不是一次将剩下的所有索引文件写完,它...
阅读全文
Lucene:(一)建立索引文件:2。建立索引文件(二)--Segment文件
摘要:Segment文件: 在随笔“Lucene:(一)建立索引文件:2。建立索引文件(一)”中提到,写索引文件从IndexWriter类开始;而IndexWriter类写索引可以看成两个方面,其中之一为IndexWriter使用SegmentInfos类写segment文件。 Segment文件实际可以看成索引的概述文件,包括了所有用于建立索引的文件的概述信息。Segment类,即Segment文件中...
阅读全文
Lucene:(一)建立索引文件:2。建立索引文件(一)
摘要:写索引文件: 索引文件在未合并前是有多个文件组成的,这些文件综合在一起,才为一个实质上的索引文件;这些文件拥有相同的名字,不同的是后缀名;下面,依次介绍这些文件,介绍方式为:从建立索引的类开始,一步步追踪,最后总结。 IndexWriter类 写索引文件从IndexWriter类开始。IndexWriter需要三个参数:分别是字典(Lucene自定义的,存放索引...
阅读全文
浙公网安备 33010602011771号