摘要: 如果你不想在mapreduce程序运行之前手动清除output目录,可以编写代码在程序运行之前清除output目录,具体做法如下:FileSystem fs =FileSystem.get(conf);Path output=new Path('/tmp/output');fs.delete(output,true);FileSystem.delete(Path f,Boolean recursive)可删除指定的HDFS文件,其中f为需要删除文件的完整路径,recuresive用来确定是否进行递归删除 阅读全文
posted @ 2013-01-09 11:21 季石磊 阅读(1686) 评论(0) 推荐(0) 编辑
摘要: 在多人共用HDFS的环境下,配置设置非常重要。特别是在Hadoop处理大量资料的环境,如果没有配额管理,很容易把所有的空间用完造成别人无法存取。Hdfs的配额设定是针对目标而不是针对账号,所有在管理上最好让每个账号仅操作某一个目录,然后对目录设置配置。 设定方法有两种:Name Quotas:设置某一个目录下文件总数Space Quotas:设置某一个目录下可使用空间大小 默认情况下Hdfs没有任何配置限制,可以使用 hadoop fs -count 来查看配置情况 hadoop fs -count -q /user/seamon 以下是结果,none和inf表示没有... 阅读全文
posted @ 2013-01-09 11:20 季石磊 阅读(1633) 评论(0) 推荐(0) 编辑