代码改变世界

Hadoop综合大作业

2018-05-25 21:59  AAAAAAABE  阅读(142)  评论(0编辑  收藏  举报

 

1.用Hive对爬虫大作业产生的文本文件(或者英文词频统计下载的英文长篇小说)进行词频统计。

 

在user/hadoop创建文件夹EnglishWord

上传文档到user/hadoop/EnglishWord文件夹中

在hive创建表world

导入文本world并查看

.

用SQL进行词频统计并保持到表word_count