博客园 首页 私信博主 显示目录 隐藏目录 管理 动画

spark 文件位置报错

任务提交指令:

spark-submit --class orderinversioninspark.RelativeFrequency ~/soft/temp/bigdataAnalysis.jar 2 /input/inputfile.txt /outputfi

异常部分信息如下:

Exception in thread "main" org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file://input/inputfile.txt
at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:285)

at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:228)

at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:313)

按理说,默认应该寻找HDFS目录下的文件,现在却找的是本地文件。具体原因想了很久也没想明白,待续。

附上自己的解决方案:

spark-submit --class orderinversioninspark.RelativeFrequency ~/soft/temp/bigdataAnalysis.jar 2 hdfs://master:8020/input/inputfile.txt /outputfi0

即添加完整的hdfs URL。

另外,若要使用本地文件的话那么URL改为:file:///home/centos/soft/files/inputfile.txt
————————————————
版权声明:本文为CSDN博主「Julian Win」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/perfer258/article/details/80714407

posted @ 2022-02-10 08:58  CHANG_09  阅读(98)  评论(0编辑  收藏  举报