摘要:
下面的文章专门针对搜索引擎里的倒排列表 sorted sets研究交集算法,思路类似快排,非常值得一看 www.cs.ucr.edu/~stelo/cpm/cpm04/25_Baeza-yates.pdf 合并sorted sequence算法: https://github.com/rklaehn 阅读全文
摘要:
lucene中用的是ConjunctionScorer ,大致过程是每条倒排链不断的推进到小于等于当前最大节点的位置。当然实现细节还是很丰富的,作者很细心的把过程都列出来了,建议顺着读一边。这里摘抄部分: 首先把倒排链按第一个next排序: 查看0~7的倒排链的第一个和最后一个是否相同,不同就开始找 阅读全文
摘要:
from:http://www.cnblogs.com/jcli/p/3984809.html 如果待合并的两个倒排表数据量很大, 但是交集很少时, 会是什么情况呢? 1 2 [1, 2, 3, 4, 5, ... 10001, 10005] [1, 10001, 10008] 如果对这两个做合并操 阅读全文