摘要: 简介四种压缩格式的优缺点以及应用场景的介绍:1 gzip压缩 优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip格式的文件就和直接处理文本一样;有hadoop native库;大部分linux系统都自带gzip命令,使用方便。 ... 阅读全文
posted @ 2017-09-07 14:47 ZC_Surpass 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 压缩在hadoop中的应用1.1压缩简介 Hadoop 作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速度,从而提高系统处理数据的效率。在使用压缩方式方面,... 阅读全文
posted @ 2017-09-07 12:28 ZC_Surpass 阅读(273) 评论(0) 推荐(0) 编辑