作业7

二. 单选题(共1题,14.3分)

三. 简答题(共1题,14.3分)

编程实践:参考教程https://dblab.xmu.edu.cn/blog/4322/,任意选择以下一种方式通过Spark API 编写一个独立应用程序。

(一)使用sbt对Scala独立应用程序进行编译打包

(二)使用Maven对Java独立应用程序进行编译打包

(三)使用Maven对Scala独立应用程序进行编译打包

并截图给出代码及运行结果。

  1. 先在linux系统中安装spark 我安装的目录为/export/server/spark

2.运行spark:先运行hadoop,start-all.sh 启动hadoop 然后进入spark目录下:cd /export/server/spark 然后执行 bin/spark-shell启动spark

3.加载文本文件:spark创建sc,可以加载本地文件和HDFS文件创建RDD。这里用Spark自带的本地文件README.md文件测试。

val textFile = sc.textFile("file:///export/server/spark/README.md")

4.下载maven

我安装的目录为:/usr/local/maven

5.创建java文件的根目录

mkdir -p ./sparkapp2/src/main/java

6.编写代码和pom.xml文件

7.使用maven进行编译打包

 

8.利用spark命令:通过spark-submit运行程序

posted @ 2023-10-24 22:24  会秃头的小白  阅读(24)  评论(0编辑  收藏  举报