hadoop初学
Hadoop:
官网(hadoop.apache.org)的定义:
一:Hadoop Common:
为Hadoop其它模块提供通用的支持
二:HDFS:
是Hadoop的分布式文件系统,其特点是高度的容错性。提供了副本(3个)的概念。
提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。
实现流的形式访问(streaming access)文件系统中的数据,重点是在数据吞吐量,而不是数据访问的反应时间
三:YARN:
是一个资源调度系统
四:MapReduce:
是一个编程环境,用于对HBase、HDFS的访问。