摘要: 历时2天半,完成了从获取数据到清洗数据到最终的展示过程。 需求:hive中有很多表,他们的存储量很大,磁盘吃紧,为了以后能清楚的看到hive库中最大的10张表,所以需要做一个展示。 整理思路: 获取数据的途径:使用hadoop fs -du -s -h 表的绝对路径 为了后期开发简单,所以就把获取的 阅读全文
posted @ 2019-12-03 17:56 任重而道远的小蜗牛 阅读(780) 评论(0) 推荐(0) 编辑