测试内容 

实际测试内容

说明

索引

将数据源中的数据都通过全文索引一一建立反向索引

对于LIKE查询来说,数据传统的索引是根本用不上的。数据需要逐个便利记录进行GREP式的模糊匹配,比有索引的搜索速度要有多个数量级的下降。

匹配效果

通过词元(term)进行匹配,通过语言分析接口的实现,可以实现对中文等非英语的支持。

使用:like "%net%" 会把netherlands也匹配出来,
多个关键词的模糊匹配:使用like "%com%net%":就不能匹配词序颠倒的xxx.net..xxx.com

匹配度

有匹配度算法,将匹配程度(相似度)比较高的结果排在前面。

没有匹配程度的控制:比如有记录中net出现5词和出现1次的,结果是一样的。

结果输出

通过特别的算法,将最匹配度最高的头100条结果输出,结果集是缓冲式的小批量读取的。

返回所有的结果集,在匹配条目非常多的时候(比如上万条)需要大量的内存存放这些临时结果集。

可定制性

通过不同的语言分析接口实现,可以方便的定制出符合应用需要的索引规则(包括对中文的支持)

没有接口或接口复杂,无法定制

结论

高负载的模糊查询应用,需要负责的模糊查询的规则,索引的资料量比较大

使用率低,模糊匹配规则简单或者需要模糊查询的资料量少

分析摘要

能力

经过测试本软件的索引,匹配效果,匹配度,结果输出,可制定性,测试试结果及发现中可以得出该软件可以执行如上功能。

缺陷和限制

经过测试,发现了一些搜索无法匹配问题,主要是数据库的覆盖不足,内容遗漏导致一些搜索方面的限制。

建议

1数据库缺陷   修改方法:增加数据库连接

                工作量不大

                修改负责人:吴贵阳

     2搜索无法匹配   修改方法:重新修改,调试

                工作量:较大

                修改负责人:杜鹏程,王金涛。