2011年9月29日
摘要: P地址最多有2^32=4G种取值可能,所以不能完全加载到内存中。可以考虑分而治之的策略,按照IP地址的hash(IP)%1024值,将海量日志存储到1024个小文件中。每个小文件最多包含4M个IP地址。对于每个小文件,可以构建一个IP作为key,出现次数作为value的hash_map,并记录当前出现次数最多的1个IP地址。有了1024个小文件中的出现次数最多的IP,我们就可以轻松得到总体上出现次数最多的IP。P地址最多有2^32=4G种取值可能,所以不能完全加载到内存中。可以考虑分而治之的策略,按照IP地址的hash(IP)%1024值,将海量日志存储到1024个小文件中。每个小文件最多包含 阅读全文
posted @ 2011-09-29 22:01 dartagnan 阅读(427) 评论(0) 推荐(0) 编辑
摘要: 现在有一个数组,已知一个数出现的次数超过了一半,请用O(n)的复杂度的算法找出这个数。第1种方法:创建一个hash_map,key为数组中的数,value为此数出现的次数。遍历一遍数组,用hash_map统计每个数出现的次数,并用两个值存储目前出现次数最多的数和对应出现的次数。这样可以做到O(n)的时间复杂度和O(n)的空间复杂度,满足题目的要求。但是没有利用“一个数出现的次数超过了一半”这个特点。也许算法还有提高的空间。第2种方法(推荐):使用两个变量A和B,其中A存储某个数组中的数,B用来计数。开始时将B初始化为0。遍历数组,如果B=0,则令A等于当前数,令B等于1;如果当前数与A相同,则 阅读全文
posted @ 2011-09-29 21:52 dartagnan 阅读(506) 评论(2) 推荐(1) 编辑
摘要: 给定一个单词a,如果通过交换单词中字母的顺序可以得到另外的单词b,那么定义b是a的兄弟单词。现在给定一个字典,用户输入一个单词,如何根据字典找出这个单词有多少个兄弟单词? 阅读全文
posted @ 2011-09-29 21:44 dartagnan 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 给定一个数组,问其中是否有两个数的和为10? 阅读全文
posted @ 2011-09-29 17:45 dartagnan 阅读(350) 评论(0) 推荐(0) 编辑
摘要: 给定一个长度为N的数组,其中每个元素的取值范围都是1到N。判断数组中是否有重复的数字。(原数组不必保留) 阅读全文
posted @ 2011-09-29 17:19 dartagnan 阅读(1088) 评论(0) 推荐(0) 编辑