Hadoop综合大作业

Hadoop综合大作业

 

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363

一、将爬虫大作业产生的csv文件上传到HDFS

 

 

 

 2.对CSV文件进行预处理生成无标题文本文件

 

3.把hdfs中的文本文件最终导入到数据仓库Hive中

 

4.在Hive中查看并分析数据

 

 

5.用Hive对爬虫大作业产生的进行数据分析,写一篇博客描述你的分析过程和分析结果。(10条以上的查询分析)

(1)

 (2)

 (3)

 (4)

 

 

 (5)

 

 (6)

 

(7)

(8)

 

 

 (9)

 

 

 (10)

 

 

 

 

 

 

 

 

 

 

 

 

 

posted on 2019-06-20 02:36  zhouyihan  阅读(119)  评论(0编辑  收藏  举报

导航