hadoop本地运行官方Grep案例 wordCount案例

环境准备点击此处查看

Grep案例

第一步: 在Hadoop文件夹下

mkdir input 

cp etc/hadoop/*.xml  input/

hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar  grep  input/   output 'dfs[a-z.]+'

执行完上一句会创建一个output文件夹(里边有两个文件)这个文件夹不能自己创建

 

 

输入 cat  part-r-00000

 

 输出结果为符合'dfs[a-z.]+'条件的数据

 

 wordCount案例

   mkdir wcinput

          cd  wcinput

   touch wc.input(名字随便起)

   vim wc.input

    输入一些数据  

tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing

保存退出

    cd .. 退回上一层

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

cd wcoutput

cat part-r-00000

 

 统计出每个单词出现的次数

 

posted @ 2019-12-11 09:52  帖子搬运工  阅读(1038)  评论(0编辑  收藏  举报