摘要: 根据Maneesh Varshney的漫画改编,以简洁易懂的漫画形式讲解HDFS存储机制与运行原理,非常适合Hadoop/HDFS初学者理解。 一、角色出演 如上图所示,HDFS存储相关角色与功能如下: Client:客户端,系统使用者,调用HDFS API操作文件;与NN交互获取文件元数据;与DN 阅读全文
posted @ 2018-03-08 18:09 大数据从业者FelixZh 阅读(1977) 评论(0) 推荐(0) 编辑
摘要: 关键字:hdfs fsck、block、locations 在HDFS中,提供了fsck命令,用于检查HDFS上文件和目录的健康状态、获取文件的block信息和位置信息等。 fsck命令必须由HDFS超级用户来执行,普通用户无权限。 下面介绍每一个选项的含义及用法。 查看文件中损坏的块(-list- 阅读全文
posted @ 2018-03-08 17:54 大数据从业者FelixZh 阅读(6825) 评论(0) 推荐(0) 编辑
摘要: http://lxw1234.com/archives/2016/04/630.htm 关键字:orc、index、hive Hive从0.11版本开始提供了ORC的文件格式,ORC文件不仅仅是一种列式文件存储格式,最重要的是有着很高的压缩比,并且对于MapReduce来说是可切分(Split)的。 阅读全文
posted @ 2018-03-08 17:07 大数据从业者FelixZh 阅读(2554) 评论(0) 推荐(0) 编辑