通过hadoop上的hive完成WordCount
启动hadoop
Hdfs上创建文件夹
上传文件至hdfs
先从自己本机使用WinSCP把文件放在linux文件夹中
然后上传到hdfs
启动Hive
创建原始文档表
导入文件内容到表docs并查看
导入操作
查看操作
用HQL进行词频统计,结果放在表word_count里
查看统计结果