摘要: hadoop生态系统如下图所示: HDFS: HDFS(Hadoop Distributed File System)是分布式文件系统,是针对谷歌开发的分布式文件系统GFS(Google File System)的开源实现,是Hadoop两大核心组成部分之一。 HDFS有NameNode和DataN 阅读全文
posted @ 2019-01-04 23:12 Kayden_Cheung 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 下图显示了HDFS文件系统中路径为“localhost:50070/explorer.html#/user/hadoop”的目录中所有的文件信息: 对于该目录下的所有文件,我们将执行以下操作: 首先,从该目录中过滤出所有后缀名不为".abc"的文件。 然后,对过滤之后的文件进行读取。 最后,将这些文 阅读全文
posted @ 2019-01-04 19:48 Kayden_Cheung 阅读(1706) 评论(0) 推荐(0) 编辑
摘要: 文件简单写操作: 文件简单读操作: 阅读全文
posted @ 2019-01-04 14:19 Kayden_Cheung 阅读(462) 评论(0) 推荐(0) 编辑
//目录