四、单机模式的测试与数据分析

数据分析。
1,数据存放目录(3个txt文件)
[root@node1 ~]# cd /usr/local/hadoop/
[root@node1 hadoop]# mkdir oo
[root@node1 hadoop]# cp LICENSE.txt NOTICE.txt README.txt ./oo
[root@node1 hadoop]# ls ./oo
LICENSE.txt NOTICE.txt README.txt
2,对上述3个文件进行分析(热词)
*搜索三个文件中出现最多的词
[root@node1 hadoop]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar wordcount oo xx
[root@node1 hadoop]# cat xx/* 这样就可以查看单词出现的次数了
......
hardware 1
hardware) 1
harmless 1
has 20
have 14
having 2
held 2
hereafter 2
hereby 20
herein 5
herein, 1
herein. 3
herein.  1
hereof. 2
hereto, 1
.............
命令解析
bin/hadoop #调用bin/hadoop
bin/hadoop jar #用Hadoop执行一个java脚本
share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar #java脚本的路径
wordcount #java脚本的方法,
oo #输入目录(可以有多个)
xx #输出目录(只能有一个,输出目录不允许存在)

posted @ 2021-08-26 15:39  落樰兂痕  阅读(54)  评论(0编辑  收藏  举报