大数据踩坑实录

大数据平台中JDK版本尽量使用1.8。我开始使用的是openJDK11，结果yarn启动不起来，出现了很多异常，还需要一些特殊的配置。
如果hadoop 集群中namenode 使用了HA配置的话，在使用Spark时需要将core-site.xml和hdfs-site.xml拷贝到Spark的conf路径中，并修改spark-default.conf.template文件。否则会有java.lang.IllegalArgumentException: java.net.UnknownHostException: hacluster 出现。
具体操作步骤：

    1.复制Hadoop目录下etc/hadoop中的hdfs-site.xml和core-site.xml文件到spark的conf/目录下；

    2.将spark的conf/目录下的spark-default.conf.template更名为spark-default.xml(mv spark-default.conf.template spark-default.xml)；

    3.在spark-default.xml文件中添加如下配置(具体路径以自己实际路径为准)：

      spark.files file:///usr/local/soft/spark-1.6.0/conf/hdfs-site.xml,file:///usr/local/soft/spark-1.6.0/conf/core-site.xml

    引用链接：[https://blog.csdn.net/sunhaoning/article/details/62214728](https://blog.csdn.net/sunhaoning/article/details/62214728)

posted @ 2019-11-23 15:53 ydk-XL 阅读(371) 评论(0) 收藏举报

刷新页面返回顶部

ydk-XL

大数据踩坑实录

公告