distcp使用

distcp在hadoop1.x和2.x存在rpc版本兼容问题,故有rpc和http两种协议选择。
 
一,rpc协议:
单主机master8020端口:hdfs dfs -ls hdfs://cdh001:8020/user/hive
HA模式:  hdfs dfs -ls hdfs://nameservice1/user/hive
 
二,http协议分两种,webhdfs和httpfs:
1, webhdfs不支持HA,端口50070: 
 
2, httpfs:
指定httpfs服务器的IP端口: 
 
 
三,webhdfs api操作hdfs文件
 
hadoop distcp -pbugp hdfs://nameservice1:8020/user/hive/warehouse/js_xiudang.db/xd_js_despatch_sku_relation/date=${date} hdfs://10.205.130.32:8020/user/hive/warehouse/js_xiudang.db/xd_js_despatch_sku_relation/date=${2016-04-10}
 
 

posted on 2018-08-03 18:05  Tank-101  阅读(383)  评论(0编辑  收藏  举报