hadoop浅尝第一个hadoop程序

hadoop编程程序员需要完成三个类。

map类，reduce类和主类。

map和reduce类自然是分别完成map和reduce。而主类则负责对这两个类设置job。完成这三个类之后，我们生成一个jar文件。利用这个jar文件完成剩下的工作。

首先，执行 bin/hdfs dfs -put /home/hadoop/test input
这里对意思是将文件/home/hadoop/test文件放入input中。这个input是提前建立好的，指令如下：

bin/hadoop fs –mkdir input

放入input之后，我们执行指令：

bin/hadoop jar /home/hadoop/workspace/test.jar InvertedIndexer input output
/home/hadoop/workspace/test.jar是先前生成的jar文件的地址，input中包含了待处理文件。至于output还有待考察。

需要注意的是，这里的InvertedIndexer就是程序员编写的三个类中的主类的名称。

posted @ 2015-04-15 15:05 ElNinoT 阅读(199) 评论(0) 收藏举报

刷新页面返回顶部

ElNinoT

hadoop浅尝 第一个hadoop程序

公告

hadoop浅尝第一个hadoop程序