摘要: Hadoop 是Apache开源组织的一个分布式开源框架,他是一个在大型集群上运行的应用程序框架。Hadoop框架透明的提供应给用程序以可靠性和数据处理方案。Hadoop实现了MapReduce计算范式,它将应用程序分成许多小片段进行工作,每一个片段都能在集群中的任何一个node上执行或者重新执行。此外,Hadoop提供了一个分布式的文件系统HDFS(Hadoop Distributed File System),用于存储计算节点上的数据,在集群中提供高聚集的带宽。MapReduce 和 HDFS两部分的设计都能保证节点上的错误能够被Hadoop这个框架自动解决。 上面说的仅仅是在wik... 阅读全文
posted @ 2011-09-25 16:33 RichardHu 阅读(503) 评论(2) 推荐(0) 编辑