摘要: SequenceFiles(序列文件)   SequenceFile是Hadoop的一种由键值对小文件组成的流行的格式。SequenceFIle有同步标记,Spark可以寻找标记点,然后与记录边界重新同步。Spark还可以从多个节点并行高效地读取SequenceFile。Sequ 阅读全文
posted @ 2018-03-14 14:45 Tikko 阅读(2056) 评论(0) 推荐(0) 编辑