摘要: Impala性能调优最佳实践概览 1选择合适的文件格式 通常对于大数据集而言(每个分区或者表的大小为几个G或者更大),推荐使用Parquet文件格式。因为它按列存储,单词IO可以请求更多的数据,另外它支持更好的压缩算法对二进制文件进行压缩。 对于小表而言(每个... 阅读全文
posted @ 2019-03-04 17:18 大数据技术与数仓 阅读(612) 评论(0) 推荐(0) 编辑