2012年10月22日
摘要: 百度的笔试、一面、二面,豆瓣的笔试题都涉及到了海量数据处理;因为不是CS专业,平时真心没用过上亿的数据量,初看到题的时候完全无从下手,顶多就一些将数据分割成很多的小文件,然后处理这些单个的文件,最后进行归并,而实现的过程也不是很清楚。 仔细回想一下《编程诛讥》里是有提到过海量数据处理的,只是当时连Bitmap都不清楚,就没有细心研究过。昨天百度一面的一道题,说有10亿个无符号的整型数据,如何找出重复的数字并统计其个数。当时,我又将“分割”的算法照搬一遍,还加上Quicksort,后面发现,归并的时候不知道怎么处理了;只好换一种思路,想到了计数排序,考官一开始没听懂,问我是不是桶,我一想,... 阅读全文
posted @ 2012-10-22 23:04 CodeAnt 阅读(233) 评论(1) 推荐(0) 编辑