HDFS2—federation
为什么会出现联盟?
一个集群中datanode的存储可以看成是无限制的,而namenode的存储是有限的,当数据过多时,namenode
联盟解决了在不同的hdfs之间,datanode的共享问题。
共享的是datanode节点,而不是共享的datanode的数据。
相当于共享的是这个datanode所在的机器上的一些硬件等一些信息。
联盟的访问问题:
挂载表:
方便在客户端访问多个NN上的资源
几个集群共享datanode,每个集群的ip不同。访问时需要区分数据到底在哪个集群上。为了解决这个问题,增加了一层,将不同的集群放在不同的目录(文件夹)下面,这样区分集群只需要知道在哪个文件夹就行。这种技术成为客户端挂载表。