四、单机模式的测试与数据分析

数据分析。
1，数据存放目录（3个txt文件）
[root@node1 ~]# cd /usr/local/hadoop/
[root@node1 hadoop]# mkdir oo
[root@node1 hadoop]# cp LICENSE.txt NOTICE.txt README.txt ./oo
[root@node1 hadoop]# ls ./oo
LICENSE.txt NOTICE.txt README.txt
2，对上述3个文件进行分析（热词）
*搜索三个文件中出现最多的词
[root@node1 hadoop]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar wordcount oo xx
[root@node1 hadoop]# cat xx/* 这样就可以查看单词出现的次数了
......
hardware 1
hardware) 1
harmless 1
has 20
have 14
having 2
held 2
hereafter 2
hereby 20
herein 5
herein, 1
herein. 3
herein. 1
hereof. 2
hereto, 1
.............
命令解析
bin/hadoop #调用bin/hadoop
bin/hadoop jar #用Hadoop执行一个java脚本
share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar #java脚本的路径
wordcount #java脚本的方法，
oo #输入目录（可以有多个）
xx #输出目录（只能有一个，输出目录不允许存在）

posted @ 2021-08-26 15:39 落樰兂痕阅读(54) 评论(0) 编辑收藏举报

刷新页面返回顶部

落樰兂痕

四、单机模式的测试与数据分析

公告