2017年6月1日

Hadoop 知识点

摘要: Hadoop 实现了一个分布式文件系统(Hadoop Distributed File System),简称 HDFS。 Hadoop的框架最核心的设计就是:HDFS 和 MapReduce。HDFS 为海量的数据提供了存储,MapReduce 为海量的数据提供了计算。 阅读全文

posted @ 2017-06-01 15:34 cag2050 阅读(156) 评论(0) 推荐(0) 编辑

Hadoop 和 Spark 的关系

摘要: Hadoop实质上是一个分布式数据基础设施: 它将巨大的数据集分派到一个由普通计算机组成的集群中的多个节点进行存储,意味着您不需要购买和维护昂贵的服务器硬件。 同时,Hadoop还会索引和跟踪这些数据,让大数据处理和分析效率达到前所未有的高度。 Spark 则是一个专门用来对那些分布式存储的大数据进 阅读全文

posted @ 2017-06-01 15:22 cag2050 阅读(517) 评论(0) 推荐(0) 编辑

导航