lucene和egg项目的异同点
1 和lucene一样 支持全域索引
2 对字符串域提供全文检索,对数字类型域提供范围查询
3 采取和lucene类似的倒排表压缩方式
4 和lucene的多级跳转表不同,egg采取的是B+树做索引,这种数据结构在应付大数量的存储上面更加适合。
5 和lucene不一样, egg不仅仅是个全文检索引擎包,采用C/S架构进行数据访问,并且制定了一套类似于sql的数据操作语法
6 可采用类似于mysql的binlog方式对数据进行主从备份
7 支持sharding的数据分布式存储方式
8 C语言实现,良好的平台移植性。
9 对不同的域能采用不用的切词方式,lucene只能用一种切词方式
参数指标
索引压缩高效,索引大小和实际数据大小比率1:1
索引创建速度快,50W条数据建立索引只需要25S
查询速度快,在50W数据总量的条件下,查询时间在0.2S以下