2018 年 7月 30 日随笔档案 - 嘣嘣嚓

HDFS数据复本存放

摘要：复本怎么放Hadoop的默认布局策略是在运行客户端的节点上放第一个复本（如果客户端运行在容器之外，就随机选择一个节点，不过系统会避免挑选那些存储太满或太忙的节点）。第二个复本放在与第一个不通且随机另外选择的机架中节点上（离架）。第三个复本与第二个复本放在同一个机架上，且随机选择另一个节点，其他复本放阅读全文

posted @ 2018-07-30 22:13 嘣嘣嚓阅读(235) 评论(0) 推荐(0) 编辑

HDFS数据流-剖析文件读取及写入

摘要： HDFS数据流-剖析文件读取及写入文件读取 1. 客户端通过调用FileSystem对象的open方法来打开希望读取的文件，对于HDFS来说，这个对象是分布式文件系统的一个实例。2. DistributedFileSystem通过使用RPC来调用namenode，以确定文件起始块的位置。对于每一个阅读全文

posted @ 2018-07-30 22:12 嘣嘣嚓阅读(485) 评论(0) 推荐(0) 编辑

HDFS请求接口

摘要：通过HTTP来访问HDFS有两种方法：直接访问，HDFS后台进程直接服务于来自客户端的请求；通过代理(一对多)访问，客户端通常使用DistributedFileSystemAPI访问HDFS。第一种情况，由namenode内嵌的web服务器（运行在50070端口上）提供目录服务，目录列表以XML或者阅读全文

posted @ 2018-07-30 22:10 嘣嘣嚓阅读(1092) 评论(0) 推荐(0) 编辑

HDFS文件访问权限

摘要： HDFS中的文件访问权限针对文件和目录，HDFS的权限模式与POSIX非常相似一共提供三类权限模式:只读权限（r）、写入权限（w）和可执行权限（x）。读取文件或列出目录内容时需要只读权限。写入一个文件或是在一个目录上新建及删除文件或目录，需要写入权限。对于文件而言，可执行权限可以忽略，因为你不能再阅读全文

posted @ 2018-07-30 22:08 嘣嘣嚓阅读(984) 评论(0) 推荐(0) 编辑

HDFS的设计

摘要：当数据集的大小超过一台独立的物理计算机的存储能力时，就有必要对它进行分区(partition)并存储到若干台单独的计算机上。管理网络中跨多台计算机存储的文件系统成为分布式文件系统(distributed filesystem)。该系统架构于网络之上，势必会引入网络编程的复杂性，因此分布式文件系统比普阅读全文

posted @ 2018-07-30 22:07 嘣嘣嚓阅读(206) 评论(0) 推荐(0) 编辑

嘣嘣嚓

HDFS数据复本存放

HDFS数据流-剖析文件读取及写入

HDFS请求接口

HDFS文件访问权限

HDFS的设计

导航

公告