Hadoop综合大作业

1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。

2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。

 

启动Hadoop

 

打开 hive

 

 显示表格,进行统计

 

 

2.用Hive对爬虫大作业产生的csv文件进行数据分析,写一篇博客描述你的分析过程和分析结果。

将文件保存到本地

 

然后打开Hadoop

 

文件上传

启动hive

新建表

加载文件

输出结果

 

 

posted @ 2018-05-25 16:36  089-袁佳鹏  阅读(98)  评论(0编辑  收藏  举报