2019年11月12日

【CDN+】 Spark 的入门学习与运行流程

摘要: 前言 上文已经介绍了与Spark 息息相关的MapReduce计算模型,那么相对的Spark的优势在哪,有哪些适合大数据的生态呢? Spark对比MapReduce,Hive引擎,Storm流式计算引擎 1.如果数据超过1T了基本就不能用spark了,还是会选择MapReduce,MapReduce 阅读全文

posted @ 2019-11-12 15:04 Charles-MQ 阅读(300) 评论(0) 推荐(0) 编辑

【CDN+】 Spark入门---Handoop 中的MapReduce计算模型

摘要: 前言 项目中运用了Spark进行Kafka集群下面的数据消费,本文作为一个Spark入门文章/笔记,介绍下Spark基本概念以及MapReduce模型 Spark的基本概念: 官网: http://spark.apache.org/ 给出了如下概念 Apache Spark™ is a unifie 阅读全文

posted @ 2019-11-12 14:16 Charles-MQ 阅读(510) 评论(0) 推荐(0) 编辑

导航