HDFS读文件详解
摘要:HDFS读文件详解通过对客户端简单读取数据的源码(见图3.1)的执行进行跟踪,可以窥探到客户端是如何读取到数据的。图3.1 客户端简单读取数据的源码 下面开始解释第5行到第12代码:第5行:根据文件的名字fileName构造一个Path类的对象path。第6行:初始化一个Configuration变量conf。第7行:根据path的成员函数getFileSystem()传入参数conf获得文件系统hdfs变量。以上三行根据文件名,得到一个FileSystem类的对象hdfs,其实hdfs是FileSystem子类DistributedFileSystem的一个对象。此处hdfs为何为Distr
阅读全文
posted @
2013-04-25 16:17
maybob
阅读(1826)
推荐(0) 编辑