摘要: 转自:http://www.iteblog.com/archives/992 Hadoop经常用于处理大量的数据,如果期间的输出数据、中间数据能压缩存储,对系统的I/O性能会有提升。综合考虑压缩、解压速度、是否支持split,目前lzo是最好的选择。LZO(LZO是Lempel-Ziv-Oberhu 阅读全文
posted @ 2016-07-11 12:28 五三中 阅读(584) 评论(0) 推荐(0) 编辑