hadoop的特点

1)高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失;

2)高扩展性:在集群间分配任务,可方便的扩展数以千计的节点;

3)高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度;

4)高容错性:能够自动将失败的任务重新分配

hdfs

HDFS是分布式文件管理系统中的一种,它是以Google的GFS为基础开发的文件系统。HDFS是可以在普通硬件上提供可靠的、可伸缩的和容错的数据存储。它与MapReduce紧密合作,将存储和计算分布在大型集群中,并结合存储资源,这些存储资源可以根据请求和查询进行伸缩,同时保持低成本和预算。