摘要: MapFile是排序后的SequenceFile, 这个排序是由开发者来保证的, 不是内存实现.相当于对key作了一个分块索引, 只针对key.缺点1.文件不支持复写操作,不能向已存在的SequenceFile(MapFile)追加存储记录2.当write流不关闭的时候,没有办法构造read流。也就... 阅读全文
posted @ 2014-09-18 11:07 谭志宇 阅读(250) 评论(0) 推荐(0) 编辑
摘要: HDFS作为Hadoop中 的一个分布式文件系统,而且是专门为它的MapReduce设计,所以HDFS除了必须满足自己作为分布式文件系统的高可靠性外,还必须为 MapReduce提供高效的读写性能,那么HDFS是如何做到这些的呢?首先,HDFS将每一个文件的数据进行分块存储,同时每一个数据块又保存有... 阅读全文
posted @ 2014-09-18 11:00 谭志宇 阅读(7073) 评论(1) 推荐(1) 编辑