pyspark 下 Spark Streaming 启动监听文件流 时报错及解决方法。
写好对文件流的监听脚本
执行ssc.start() 时报错显示:
An error occurred while calling z:org.apache.spark.streaming.api.python.PythonDStream.callForeachRDD.
无法启动监听进程
在环境变量中添加:
export SPARK_YARN_USER_ENV=PATHONHASHSEED=0
使环境变量生效。