会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Ido
我的博客
首页
新随笔
联系
订阅
管理
2016年4月22日
MapReduce输入格式
摘要: 文件是 MapReduce 任务数据的初始存储地。正常情况下,输入文件一般是存储在 HDFS 里面。这些文件的格式可以是任意的:我们可以使用基于行的日志文件, 也可以使用二进制格式,多行输入记录或者其它一些格式。这些文件一般会很大,达到数十GB,甚至更大。那么 MapReduce 是如何读取这些数据
阅读全文
posted @ 2016-04-22 22:01 ido
阅读(4614)
评论(0)
推荐(0)
编辑
公告