摘要: 1、spark是什么? Spark是基于内存计算的大数据并行计算框架。 1.1 Spark基于内存计算 相比于MapReduce基于IO计算,提高了在大数据环境下数据处理的实时性。 1.2 高容错性和高可伸缩性 与mapreduce框架相同,允许用户将Spark部署在大量廉价硬件之上,形成集群。 2 阅读全文
posted @ 2017-05-22 21:38 扎心了老铁 阅读(11038) 评论(0) 推荐(0) 编辑