摘要: 一、认识布隆过滤器 场景:如果遇到网页黑名单系统、垃圾邮件过滤系统、爬虫的网站判重系统等题目,又看到系统容忍一定程度的失误率,但是对空间要求比较严格,那么大概率考布隆过滤器的知识。 一个布隆过滤器精确地代表一个集合,并可以精确判断一个元素是否在集合中。 到底有多精确取决于具体的设计,但完全正确是不可 阅读全文
posted @ 2020-11-30 17:56 不学无墅_NKer 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 一、理论 LRU是一种缓存淘汰策略,最近使用的认为是「有用的」,很久没使用过的数据认为是无用的,缓存满时就优先删除它们。 LRU- Least recently used(最近最少使用页面置换算法、按访问的时序来淘汰) LFU- Least frequently used(最近最不常用页面置换算法、 阅读全文
posted @ 2020-11-30 16:38 不学无墅_NKer 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 一、理论 并查集的定义: 并查集是一种树型的数据结构,用于处理一些不交集的合并和查询问题。一般用数组实现。 Find:确定元素属于哪一个子集,它可以被用来确定两个元素是否属于同一个子集。 Union:将两个子集合并成同一个集合。 并查集的优化: 优化1: 降低rank,提高查询效率。合并时要考虑ra 阅读全文
posted @ 2020-11-30 11:36 不学无墅_NKer 阅读(132) 评论(0) 推荐(0) 编辑