www.cnblogs.com/ruiyqinrui

开源、架构、Linux C/C++/python AI BI 运维开发自动化运维。 春风桃李花 秋雨梧桐叶。“力尽不知热 但惜夏日长”。夏不惜,秋不获。@ruiY--秦瑞

python爬虫,C编程,嵌入式开发.hadoop大数据,桉树,onenebula云计算架构.linux运维及驱动开发.

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

 

1、打开cygwin,启动hadoop,运行jps命令查看节点启动情况

2、切换到hadoop根目录,运行指令 echo "hello boy hei baby hello word hello hadoop baby girl baby">f1.txt 在hadoop根目录下新建f1.txt,可用-ls 查看是否创建成功

3、运行指令 bin/hadoop fs -mkdir input 在hdfs上新建一文件夹,命名为input

4、运行指令 bin/hadoop fs -put f1.txt input 将f1.txt复制到input文件夹下,运行bin/hadoop fs -ls input查看是否复制成功

5、运行指令 bin/hadoop jar hadoop-0.20.2-examples.jar wordcount input output 并输出到output文件夹下

6、运行指令 bin/hadoop fs -cat output/* 查看输出结果,即词频统计结果

posted on 2013-12-11 09:55  秦瑞It行程实录  阅读(289)  评论(0编辑  收藏  举报
www.cnblogs.com/ruiyqinrui