摘要:
Hadoop:Google云计算的开源实现Hadoop是Apache开源组织的一个分布式计算机框架,可以在大量廉价的硬件设备组成的集群上运行应用程序,为应用程序提供一组稳定可靠的接口,旨在构建一个具有高可靠性和良好扩展性的分布式系统。Hadoop的核心是HDFS,MapReduce和HBase,它们分别对应Google的云计算GFS,MapReduce和Bigtable。Hadoop主要由以下几个子项目组成:1)Hadoop Common:原来的Hadoop Core,这是整个Hadoop项目的核心2)Avro:Hadoop的RPC方案3)Vhukwa:一个用来管理大型分布式系统的数据采集系统 阅读全文