hadoop 输入路径用正则表达式被默认处理为多个参数的问题
运行命令
hadoop jar wordcount.jar com.WordCount /inpath/*{beijing,shanghai,guangzhou}* /outpath/
这个/inpath/*{beijing,shanghai,guangzhou}* 地址,hadoop自己会解析为多个参数,判定第二个参数,不是输出路径
解决方式:
hadoop jar wordcount.jar com.WordCount /inpath/'{*beijing*,*shanghai*,*guangzhou*}' /outpath/
这样就可以了。