会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
张超五
博客园
首页
新随笔
联系
订阅
管理
2017年9月26日
大数据面试题
摘要: 1.有两个a,b两个文件,每个文件内有50亿个url,每个url占64个字节,内存限制是4G,请找吃a,b文件都拥有的url。 解答思路:分治+hash 50*1000,000,000*64字节=3.2*1000,000,000,000字节 约= 3200G 通过hash(url)%1600,把a文
阅读全文
posted @ 2017-09-26 14:59 张超五
阅读(385)
评论(0)
推荐(0)
编辑