会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
奇遇yms
博客园
首页
新随笔
联系
订阅
管理
2021年5月17日
海量数据常见面试问题
摘要: 1.统计出IP的文件,哪个ip出现的次数最多,一行一个ip。如果文件很大,超过内存。 (1)将ip地址放入多个小文件中,保证每种IP只出现在一个文件中(2)利用hashmap统计每个小文件中IP出现的次数(3)利用最小堆得到所有IP访问次数最多的100个 2.给定a、b两个文件,各存放50亿个url
阅读全文
posted @ 2021-05-17 23:05 奇遇yms
阅读(143)
评论(0)
推荐(0)
编辑
公告