随笔分类 - Spark
摘要:一、 创建工程或者模块 如果已经存在工程,那么可以在当前工程下创建模块。 如果不存在工程,可以直接创建一个工程。 1.1 创建maven模块 由于已经存在一个相同的模块,我这里标红了。 1.2 修改pom文件 <?xml version="1.0" encoding="UTF-8"?> <proje
阅读全文
摘要:前言 HDP version: 3.x HIVE version: 3.x 问题描述 使用hdp版本的集群服务,当安装好spark以后,执行spark.sql ,不能查询到hive的数据库,只查询到default数据库,说明spark没有连接到hive。 问题现象 分析: 1、通过上图可以看到spa
阅读全文
摘要:使用spark on yarn跑任务的时候,出现了异常错误,错误如下: hduser@xxx:/data1/hadoop/spark/bin$ ./spark-shell --master yarn --deploy-mode client 2020-04-13 10:04:25 WARN Nati
阅读全文
摘要:Application application和Hadoop MapReduce类似,都是指用户编写的spark应用程序,其中包含了一个driver功能的代码和分布在集群中多个节点运行的executor代码。 Driver 使用driver这一概念的分布式框架很多,比如hive。spark中的dri
阅读全文
摘要:1、执行spark-submit时出错 执行任务如下: # ./spark-submit --class org.apache.spark.examples.SparkPi /hadoop/spark/examples/jars/spark-examples_2.11-2.4.0.jar 100 报
阅读全文