Hadoop介绍

一:来源

    雅虎--->谷歌两篇论文GFS,mapreduce。

二:组成

    hadoop common:支持其他Hadoop模块的常用工具。 

     HDFS:分布式文件系统,提供对应用程序数据的高吞吐量访问。全称:Hadoop Distributed File System。

    hadoop yarn:作业调度和集群资源管理的框架。

    hadoop mapreduce:基于YARN的大型数据集并行处理系统。

    Apache的其他Hadoop相关项目包括:Ambari™Avro™Cassandra™Chukwa™HBase™Hive™Mahout™Pig™Spark™Tez™ZooKeeper™

三:hadoop是可靠的可扩展的分布式计算软件,还有一点是高性能的,他需要其他的软件的共同来实现这个特性。

posted @ 2018-05-19 19:32  Coding_Now  阅读(167)  评论(0编辑  收藏  举报