会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
扎心了,老铁
博客园
首页
新随笔
联系
订阅
管理
2018年3月7日
Hadoop学习之路(一)理论基础和逻辑思维
摘要: 三个题目 第一题 问题描述 统计出当前这个一行一个IP的文件中,到底哪个IP出现的次数最多 解决思路 问题难点 1、当读取的文件的大小超过内存的大小时,以上的解决方案是不可行的。 2、假如说你的内存足够大,能装下这个文件中的所有ip,整个任务的执行效率会非常低,消耗的时间会非常的长。 1GB --
阅读全文
posted @ 2018-03-07 18:33 扎心了,老铁
阅读(12919)
评论(4)
推荐(1)
编辑
公告