dairui130

导航

2019年3月1日 #

Hive ORC + SNAPPY

摘要: Hive orc 格式 + snappy 压缩是比较常用的存储加压缩格式。 今天处理下面的场景时,解决了一些问题,记录下来: flume消费kafka的数据实时写入hdfs,通过创建分区表,t + 1 时,需要看到昨天的数据: flume 通过snappy 将数据写入hdfs,可以通过在fliume 阅读全文

posted @ 2019-03-01 19:02 dairui130 阅读(5946) 评论(0) 推荐(0) 编辑