摘要: 教你如何迅速秒杀掉:99%的海量数据处理面试题作者:July出处:结构之法算法之道blog前言 一般而言,标题含有“秒杀”,“99%”,“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌,但进一步来讲,如果读者读罢此文,却无任何收获,那么,我也甘愿背负这样的罪名,:-),同时,此文可以看做是对... 阅读全文
posted @ 2014-08-31 13:26 一束光 阅读(477) 评论(0) 推荐(0) 编辑
摘要: 需求: 现有一个1G左右的日志文件,大约有500多万行, 用php返回最后几行的内容。在php中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file、file_get_contents之类的函数,简简单单的几行代码就能 很漂亮的完成我们所需要的功能。但当所操作的文件是一个比较大的文件时,这些函... 阅读全文
posted @ 2014-08-31 13:22 一束光 阅读(2785) 评论(2) 推荐(0) 编辑
摘要: 第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法, 比如模1000,把整个大文件映射为1000个小文件,再找出每个小... 阅读全文
posted @ 2014-08-31 13:11 一束光 阅读(810) 评论(0) 推荐(0) 编辑

友情链接

CFC4N