摘要:
1.1 分桶表 1.1.1 分桶表概念 分区和分桶可以同时,分桶是更细粒度的分配方式。分区是追求效率,分桶又解决什么问题呢?海量数据的分开存储。 对于每一个表(table)或者分区, Hive可以进一步组织成桶,也就是说桶是更为细粒度的数据范围划分。Hive也是针对某一列进行桶的组织。Hive采用对 阅读全文
摘要:
1.1 使用Flume收集数据落地HDFS 1.1.1 实现方案 log4j和flume整合 配置log4j.properties 配置flume-jt.properties 复制依赖jar文件 进入共享目录 cd /usr/local/src/hadoop/hadoop-2.7.1/share/h 阅读全文