lucene合并测试的总结
1 查询的总时间等于每个segment查询时间的总和
2 合并的步骤
(1)做flush操作的先生成一个新的segment
(2)检查在新segment之前已经存在的segment的数量是否大于maxmerge(默认是10个),大于了进行合并
(3)合并完成又会生成一个新的segment,然后把前面10个segment删除。
每次追加46W条数据(46W一次提交) kfc数据,单field,单字分词,保存termvector,position,offset和payload信息,每次追加以后进行一次查询测试。
每次提交46W数据花费42-43S左右的时间 查询时间提高0.05秒,加入第12个segment的时候触发合并,合并前690MB,合并后425MB,12segment查询一次0.5S,查到3293508数据,12个segment生成到合并花费560S
总时间 42*11+560
egg同类测试(单字分词,压缩方式)
每批数据在22S左右,12次提交以后文件总大小1.3G,花费时间为244S,查询到 3293508花费 1.335018s
总时间 22*12