Spark Submit的一些注意事项

脚本示例

spark-submit --master yarn \
--packages org.yang.component:common:1.2.3-SNAPSHOT,com.cloudera.impala.jdbc:ImpalaJDBC41:2.5.41 \
--repositories https://nexus.yang.cn/repository/maven-public/ \
--deploy-mode cluster \
--class org.resourcesubmit.spark.app.RSKafkaToHive \
--num-executors 1 \
--executor-memory 1G \
--executor-cores 2 \
--driver-memory 512m \
--conf yarn.nodemanager.resource.memory-mb=512 \
--conf yarn.scheduler.maximum-allocation-mb=1024 \
--conf spark.executor.memoryOverhead=1024 \
--conf spark.core.connection.ack.wait.timeout=500 \
--conf mapreduce.fileoutputcommitter.marksuccessfuljobs=false \
oss://jars/sensor/ResourceSubmitETL-1.0-SNAPSHOT-jar-with-dependencies.jar 参数1 参数2

注意点

1. -- conf 这种参数配置形式 ‘=’前后不能有空格

2.声明jar 包一定要放在最后，之后只能跟要传入的参数，其他的全部失效

3.当jar包引用了maven私服中的依赖时，需要指明maven仓库地址和packages， packages这个参数是要传你引用了哪些个包，否则就会报ClassNotFoundException

参数配置参考

附上参考链接 https://www.cnblogs.com/weiweifeng/p/8073553.html

posted @ 2020-08-25 14:17 可以看看你胖次吗阅读(567) 评论(0) 收藏举报

刷新页面返回顶部

可以看看你胖次吗

欲上九天揽月，纵然失败，仍与星辰同在！

Spark Submit的一些注意事项

脚本示例

注意点

参数配置参考

公告