https://hadoop.apache.org/docs/r1.2.1/hdfs_user_guide.html

hdfs的一些特征:

 1.hadoop 包含hdfs 很适合分布式存储以及分布式处理,它是容错的,可伸缩的,并且容易扩展的。MapReduce 以他的简单和适用性为一系列分布式系统服务。

 2.HDFS是一个高可配置的并且有很好的给每个应用的默认的配置。很多时候,配置只有在很大集群时才需要修改。

 3.hadoop是使用java编写,可以在很多主流平台使用。

 4.Hadoop支持使用类shell命令行与HDFS交互。

 5.NameNode 和DataNodes 是部署在服务端,很容易检测到集群的状态。

 6.新的特性和提示常规的发布,如:

  文件权限  

  Rack awareness  在调度任务和分配容量时,获得node的物理节点位置

  安全模式:管理员权限

  fsck:文件诊断

  rebalancer:重新平衡集群

  升级和回滚

  Secondary NameNode