[原]Hadoop例程:从URL中读数据

在研究Hadoop时,参考Hadoop权威指南。有一段通过URL读文件的例程:

 

 

对于刚刚接触Hadoop来说,有几个注意的地方:

 

1、开发、编译时,要把hadoop-common-0.21.0.jar加到CLASSPATH中

2、运行时不用指定jar包,但要把XXX.class文件放到$CLASSPATH目录中

3、书中给的URL是:hdfs://localhost/user/tom/quangle.txt

  没有搞明白为什么路径中还要指定主机名,实验也没成功。

  我是通过http://192.168.11.230:50070/(IP是Namenode节点主机IP)查看filesystem,如果需要的路径是/input/hadoop-hadoop-secondarynamenode-wwj1.log,要在前面加上协议hdfs://组成:

  hdfs:///input/hadoop-hadoop-secondarynamenode-wwj1.log

作者:basecn 发表于2010-9-15 9:50:00 原文链接
阅读:174 评论:0 查看评论
posted @ 2010-09-15 09:50  BaseCN  阅读(185)  评论(0编辑  收藏  举报