摘要:
查黑名单(大数据 100亿数据) 不理想的是: 1.使用哈希表来查(要使用非常大的空间) 2.改进:使用哈希分流,然后将使用多个计算机处理(浪费机器,代价高) 理想的是使用布隆过滤器(一种集合,但是有失误率,不属于黑名单的url可能会被认为在黑名单中,误报): 使用的是基本数据类型的数组 然后使用数 阅读全文
摘要:
设计一种结构, 在该结构中有如下三个功能:insert(key): 将某个key加入到该结构, 做到不重复加入。delete(key): 将原本在结构中的某个key移除。 getRandom():等概率随机返回结构中的任何一个key。【要求】 Insert、 delete和getRandom方法的时 阅读全文