摘要: 最近仔细研究了以下公司中使用的SequenceFile文件格式,SequenceFile的格式比较紧凑,实现了从中间读取文件内容(便于hadoop将文件进行适当地切分),同时也可以支持仅读取文件的元数据功能。 概述经过总结后的文件格式图大概如下: 其中进入到SequenceFile的所有... 阅读全文
posted @ 2014-10-08 23:00 clamaa 阅读(491) 评论(0) 推荐(0) 编辑