一、词频统计
1、编写mapper.py和 编写reduce.py
2.编写map与reduce函数
3.本地测试map与reduce
4.将文本数据上传至HDFS上
5.用hadoop streaming提交任务
6.查看运行结果
7.计算结果取回到本地