摘要: Spark——local模式环境搭建 一、Spark运行模式介绍 1、本地模式(loca模式):spark单机运行,一般用户测试和开发使用 2、Standalone模式:构建一个主从结构(Master+Slave)的spark集群,spark运行在集群中。 3、Spark on yarn 模式:Sp 阅读全文
posted @ 2019-05-06 10:37 技术小白丁 阅读(3012) 评论(0) 推荐(0) 编辑
摘要: Spark版本:Spark-2.1.0 Hadoop版本:hadooop-2.6.0-cdh5.7.0 官方文档:http://spark.apache.org/docs/latest/building-spark.html 一、环境配置 安装并配置好JDK 安装并配置好MAVEN 安装并配置好SC 阅读全文
posted @ 2019-05-06 10:35 技术小白丁 阅读(347) 评论(0) 推荐(0) 编辑
摘要: Spark——初识spark 一、Spark背景 1)MapReduce局限性 <1>仅支持Map和Reduce两种操作,提供给用户的只有这两种操作 <2>处理效率低效 Map中间结果写磁盘,Reduce写HDFS,多个MR之间通过HDFS交换数据 任务调度和启动开销大: mr的启动开销一,客户端需 阅读全文
posted @ 2019-05-06 10:34 技术小白丁 阅读(282) 评论(0) 推荐(0) 编辑