摘要: 结果如下: 阅读全文
posted @ 2017-05-05 18:43 Nyx丶 阅读(2211) 评论(0) 推荐(0)
摘要: 搜索引擎选型调研文档 Elasticsearch简介 Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。 Elasticsearch是一个建立在全文搜索引擎 Apache 阅读全文
posted @ 2017-04-14 10:51 Nyx丶 阅读(227) 评论(0) 推荐(0)
摘要: 一、总论 根据http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。 那么什么叫做全文检索呢?这要从我们生活中的数据说起。 我们生活中的数据总体分 阅读全文
posted @ 2017-02-08 16:59 Nyx丶 阅读(220) 评论(0) 推荐(0)
摘要: Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。一. 实例 为了说明Bloom Filter存在的重要意义,举一个实例: 假设要你写一个网络蜘蛛(web crawler)。由 阅读全文
posted @ 2016-01-27 15:43 Nyx丶 阅读(374) 评论(0) 推荐(0)