摘要: 一、优缺点 优点: 1,减少存储磁盘空间,降低单节点的磁盘IO。 2,由于压缩后的数据占用的带宽更少,因此可以加快数据在Hadoop集群流动的速度。例如在不同节点创建3个replica的阶段,或是shuffle阶段。 缺点: 需要花费额外的时间/CPU做压缩和解压缩计算 二、几种常见的压缩对比 三、 阅读全文
posted @ 2017-12-19 14:44 一醉方休 阅读(2611) 评论(1) 推荐(1) 编辑