博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2018年6月5日

摘要: 问题:有10 亿个 url,每个 url 大小小于 56B,要求去重,内存只给你4G 思路: 1.首先将给定的url调用hash方法计算出对应的hash的value,在10亿的url中相同url必然有着相同的value。 2.将文件的hash table 放到第value%n台机器上。 3.valu 阅读全文

posted @ 2018-06-05 15:01 和风细雨汪汪 阅读(8985) 评论(1) 推荐(2) 编辑

摘要: 有个输出0和1的BIASED RANDOM,它以概率p输出1,以概率1-p输出0,以此RANDOM函数为基础,生成另一个RANDOM函数,该函数以1/2的概率输出1,以1/2的概率输出0 题目解答: 两次调用该RANDOM函数,如果其概率为P(x),调用2次 P(1) = p P(0) = 1-p 阅读全文

posted @ 2018-06-05 11:44 和风细雨汪汪 阅读(1011) 评论(0) 推荐(0) 编辑