基于Livy的Spark提交平台搭建与开发

　　为了方便使用Spark的同学提交任务以及加强任务管理等原因，经调研采用Livy比较靠谱，下图大致罗列一下几种提交平台的差别。

　　本文会以基于mac的单机环境搭建一套Spark+Livy+Hadoop来展示如何提交任务运行,本文只针对框架能够运行起来，至于各个组件参数怎么配置性能更好，各位兄弟就自行找度娘了。

一.搭建Spark

访问http://spark.apache.org/downloads.html下载安装包，然后按照以下步骤操作即可。

1.下载完成后解压到某个目录下，在该目录执行以下命令

tar zxvf spark-2.1.0-hadoop2.7.tgz

2.配置Spark环境变量

Mac环境变量一般在/etc/profile下配置，打开profile文件在文件中添加。

#SPARK VARIABLES START

export SPARK_HOME =/usr/local/spark-2.1.0-hadoop2.7

export PATH = ${PATH}:${SPARK_HOME}/bin

#SPARK VARIABLES END

3.配置Java环境

同样在/etc/profile下配置。在此之前已经安装scala和jdk相关环境。将java安装目录添加到里面export JAVA_HOME =/Library/java/javaVirtualMachines/jdk1.8.0_111.jdk/COntents/Home 设置完成后,保存退出,最后使用source /etc/profile 使环境变量生效。

4.执行sbin/start-all.sh，启动spark

5.测试

打开终端，输入pyspark，出现下面的画面即表示安装成功。