摘要: HDFS读文件详解通过对客户端简单读取数据的源码(见图3.1)的执行进行跟踪,可以窥探到客户端是如何读取到数据的。图3.1 客户端简单读取数据的源码 下面开始解释第5行到第12代码:第5行:根据文件的名字fileName构造一个Path类的对象path。第6行:初始化一个Configuration变量conf。第7行:根据path的成员函数getFileSystem()传入参数conf获得文件系统hdfs变量。以上三行根据文件名,得到一个FileSystem类的对象hdfs,其实hdfs是FileSystem子类DistributedFileSystem的一个对象。此处hdfs为何为Distr 阅读全文
posted @ 2013-04-25 16:17 maybob 阅读(1808) 评论(0) 推荐(0) 编辑