会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
nosaferyao
博客园
首页
新随笔
联系
管理
订阅
2012年10月6日
hadoop 使用 streaming 读入 sequence file 注意的地方
摘要: 读入的时候, 和期待的原始文件还是不一样的。当我们使用 hadoop fs -text 打印 sequence file的时候, 会发现打印的格式是:num"\t"data 这样的格式。在使用 streaming 读入 sequence file 设置: -inputformat org.apache.hadoop.mapred.SequenceFileAsTextInputFormat的时候, 读入的数据的格式也是这样的。在使用的时候, 需要注意一下。
阅读全文
posted @ 2012-10-06 11:00 nosaferyao
阅读(465)
评论(0)
推荐(0)
编辑
公告