hadoop本地运行官方Grep案例 wordCount案例

Grep案例

第一步: 在Hadoop文件夹下

mkdir input

cp etc/hadoop/*.xml input/

hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'

执行完上一句会创建一个output文件夹(里边有两个文件)这个文件夹不能自己创建

输入 cat part-r-00000

输出结果为符合'dfs[a-z.]+'条件的数据

wordCount案例

　　　mkdir wcinput

cd wcinput

　　　touch wc.input(名字随便起)

　　　vim wc.input

　　　　输入一些数据

tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing

保存退出

　　　　cd .. 退回上一层

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

cd wcoutput

cat part-r-00000

统计出每个单词出现的次数

posted @ 2019-12-11 09:52 帖子搬运工阅读(1073) 评论(0) 收藏举报

刷新页面返回顶部

搬运工(可内推海康威视)