归档
/tmp/mes/2020072310 是将HDFS上的那个目录下的文件归档。
/tmp/mes/20200723 归档到那个目录下
hadoop archive -archiveName input.har -p /tmp/mes/2020072310 /tmp/mes/20200723
归档之后:
hadoop fs -ls /tmp/mes/
hadoop fs -ls /tmp/mes/20200723/input.har
hadoop fs -ls har:///tmp/mes/20200723/input.har
删除与恢复:
hdfs文件被归档后,系统不会自动删除源文件,需要手动删除。
hadoop fs -rmr /tmp/mes/2020072310/* 正则表达式来删除的,大家根据自己的需求删除原始文件
有人说了,我删了,归档文件存在,源文件不在了,如果要恢复怎么办,其实这也很简单,直接从har 文件中 cp出来就可以了。
hadoop fs -cp har:///tmp/mes/20200723/input.har/* /tmp/mes/2020072310/