Hadoop总结(1)-体系

hadoop是一个开源分布式计算平台,以hadoop分布式文件系统HDFS和大规模数据分布式编程模型MapReduce为核心。它为用户提供了底部细节透明的分布式基础架构。
 
HDFS的高容错性,高伸缩性等特点允许用户将hadoop部署在低廉的硬件上,形成分布式系统;而MapReduce分布式编程模型允许用户在不了解系统底层细节的情况下开发并行应用程序。再者,配合其他项目(如下图)的使用,使得用户可以利用hadoop轻松地组织计算机资源,利用集群的计算和存储能力,处理海量数据。
 
hadoop主要相关项目,我总结了下面一张图供大家参考:
 
 
这些子项目的总结会陆续给出!
 
posted @ 2013-10-15 17:34  huidaoli  阅读(104)  评论(0编辑  收藏  举报