yangyang12138

导航

2020年8月21日 #

数据迁移

摘要: 1.概述 大数据组件中数据量较大且都是分布式的,跨集群的迁移主要用作备份。 2.HDFS 可以通过分析editlog来确定数据变更的分区,然后通过distcp命令来完成。 3.HBase 可以通过TimeRange来查询增量数据 在old cluster中每一个regionserver下 <prop 阅读全文

posted @ 2020-08-21 03:06 杨杨09265 阅读(132) 评论(0) 推荐(0) 编辑