MapReduce程序实现词频统计

一、要求：

首先在Linux系统 /usr/local/Hadoop 目录下创建两个文件，即wordfile1.txt和wordfile2.txt

文件wordfile1.txt内容如下：

I love Spark

I love Hadoop

文件wordfile2.txt内容如下：

Hadoop is good

Spark is fast

统计词频输出结果：

fast 1

good 1

Hadoop 2

I 2

is 2

love 2

Spark 2

程序编译错误时，鼠标点击有红色波浪线的程序，按提示修改即可

本实验运用MapReduce程序实现了词频统计功能。在编写MapReduce程序之前，需要先判断目标任务是否可以采用MapReduce编程。MapReduce会把一个大的文件切分为很多小片段进行分布式并行处理，最终对不同片段的处理结果进行汇总。

参考文献：《大数据基础编程、实验和案例教程》 by 林子雨

posted @ 2022-05-28 00:13 tiansz 阅读(384) 评论(0) 编辑收藏举报

刷新页面返回顶部