摘要: 作者:July、youwang、yanxionglu。时间:二零一一年三月二十六日本文之总结:教你如何迅速秒杀掉:99%的海量数据处理面试题。有任何问题,欢迎随时交流、指正。出处:http://blog.csdn.net/v_JULY_v。------------------------------------------第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000 阅读全文
posted @ 2012-07-05 20:52 曾先森在努力 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 在使用电脑的时候,发现自己的电脑上有其他的用户登陆。如果其他用户用的是自己的名字,那么就能通过who去查询出来,但是如果登陆的都是root用户,那么肯定不知道是谁,所以需要我们清除他们;另外呢,如果登陆的用户突然断掉,那么肯定会有过期的登陆信息需要清除1,查明登陆端口;# whoroot pts/1 Apr 8 00:06 (172.29.0.29)root pts/2 Apr 8 04:15 (172.29.0.21)2,通知该用户将要关闭他:# echo "I will close your connection" > /dev/pts/2这样他的终端将显示该信息 阅读全文
posted @ 2012-07-05 16:21 曾先森在努力 阅读(1586) 评论(0) 推荐(0) 编辑