Lucene 基础类型

Lucene 索引文件中,用一下基本类型来保存信息:
1. Byte:是最基本的类型,长 8 位(bit)。
2. UInt32:由 4 个 Byte 组成。
3. UInt64:由 8 个 Byte 组成。
4. VInt:
" 变长的整数类型,它可能包 多个 Byte,对于每个 Byte 的 8 位,其中后 7 位表示数值,最高 1 位表示是否还有另一个 Byte,0 表示没有,1 表示有。
" 越前面的 Byte 表示数值的低位,越后面的 Byte 表示数值的高位。
" 例如 130 化为二进制为 1000, 0010,总共需要 8 位,一个 Byte 表示不了,因而需要两个 Byte 来表示,第一个 Byte 表示后 7 位,并且在最高位置 1 来表示后面还有 一个Byte,所以为(1) 0000010,第二个Byte表示第8位,并且最高位置0来表示 后面没有其他的 Byte 了,所以为(0) 0000001。

 5.Chars:是 UTF-8 编码的一系列 Byte。

 6.String:一个字符串首先是一个 VInt 来表示此字符串包 的字符的个数,接着便是 UTF-8编码的字符序列 Chars。

posted on 2017-09-13 18:04  kenny.wmh  阅读(144)  评论(0编辑  收藏  举报

导航