hadoop初学

Hadoop:

官网(hadoop.apache.org)的定义:

 

一:Hadoop Common:

  为Hadoop其它模块提供通用的支持

二:HDFS:

  是Hadoop的分布式文件系统,其特点是高度的容错性。提供了副本(3个)的概念。

  提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。

  实现流的形式访问(streaming access)文件系统中的数据,重点是在数据吞吐量,而不是数据访问的反应时间

三:YARN:

      是一个资源调度系统

四:MapReduce:

     是一个编程环境,用于对HBase、HDFS的访问。

 

      

posted @ 2017-04-25 09:46  裸奔的太阳  阅读(158)  评论(0编辑  收藏  举报