Google分布式计算框架 VS 开源实现版本Hadoop
Google分布式计算框架的开源实现版本---hadoop
hadoop是google的云计算系统的开源实现,用java开发。Hadoop由 Apache Software Foundation(阿帕奇软件基金会)公司于 2005 年秋天作为Lucene的子项目Nutch的一部分正式引入。它受到最先由 Google Lab 开发的 Map/Reduce 和 Google File System(GFS) 的启发。HDFS基本可以认为是GFS的一个简化版实现,二者因此有很多相似之处。HBase是Google的BigTable架构的一个开源实现。
Google分布式计算框架主要包括三个部分:
- 分布式文件系统Google File System (GFS);
- 分布式并行计算模型map/reduce;
- 分布式数据库Bigtable。
- 此系统由Google公司自己开发,
- 闭源。
MapReduce的系统实现至今仍为谷歌机密,而开源的版本Hadoop效率低下(据谷歌内部人士透露,5年前的谷歌MapReduce版本也比当前的Hadoop快一个数量级;现在谷歌的版本到底有多快,是否有新的功能,不得而知)。参考
- Google的分布式锁Chubby
开源实现版本:Hadoop
- HDFS对应谷歌的GFS;参考
- Hadoop的map/reduce对应谷歌的map/reduce模型;
- Hbase对应谷歌的分布式数据库Bigtable;
- 此项目由Apache基金会管理
- 开源项目
- Zookeeper对应Google的分布式锁Chubby。