摘要: 引出布隆过滤器(Bloom-Filter) 在海量数据面前如何去过滤,及查找数据。下面有几个问题: 1. 总共有50亿个电话号码,现在已经知道10万个号码,如何在这100亿个电话号码中去快速判断这些10万个号码是否存在? 2. 垃圾邮件过滤。 3.wps文字处理软件错误单词的检测。 4. 网络爬虫重 阅读全文
posted @ 2018-05-08 23:46 songguojun 阅读(769) 评论(0) 推荐(0) 编辑
摘要: Linux下的五种IO模型 1.阻塞IO(blocking IO) 2.非阻塞IO (nonblocking IO) 3.IO复用(select 和poll) (IO multiplexing) 4.信号驱动IO (signal driven IO (SIGIO)) 5.异步IO (asynchro 阅读全文
posted @ 2018-05-08 18:45 songguojun 阅读(275) 评论(0) 推荐(0) 编辑