伪分布式hbase数据迁移汇总

https://www.jianshu.com/p/990bb550be3b

 

hbase0.94.11(hadoop为1.1.2,此电脑ip为172.19.32.128)向hbase1.1.2 (hadoop为2.6.5,此电脑ip为172.19.32.118)数据迁移.

 

第一步:首先必须关闭防火墙。

         Sudo ufw status   (如果没有下载ufw,则sudo apt-get install ufw)

         Sudo ufw enable

         Sudo ufw disable

         Sudo ufw allow|deny 8000

 

第二步进行迁移

  方式一:

  用snapshot进行数据迁移时需要localhost的地方把hadoop的core-site.xml中的fs.default.name设置为localhost。不要使用本机ip,即172.19.32.128。

     

     

  方式二:

  使用hadoop fs –cp命令,进行数据迁移时,双方的ip必须按照hadoop的core-site.xml中的fs.default.name来写。(src中配置为localhost,des中配置是其本机的地址,即172.19.32.118).

 

     

 

  方式三:

  使用hadoop的distcp工具进行数据迁移:

     

 

 

 

数据迁移总结:

    1. hadoop distcp

    将hbase存储在hdfs上面的数据目录全部从当前集群拷贝至目标集群hbase对应的hdfs目录;

    hadoop distcp -f hbasedir "hdfs://new cluster ip:9000/hbasedir

    说明:此方案只适用于离线迁移;且测试由0.94–》1.1.2版本测试失败。同版本的数据迁移(备份)没问题 。

 

    2. hadoop fs –cp

    此操作可以进行本地文件系统和hdfs中数据的导入导出。实现两个集群的hdfs进行,此操作需要消耗大量的网络带宽,速度慢。测试由0.94–》1.1.2版本测试失败。

 

    3.hbase –snapshot

    此操作进行数据迁移比较高效,较推荐。测试由0.94–》1.1.2版本测试失败。

 

         以上三种都需要注意ip的设置。

 

posted @   _Meditation  阅读(334)  评论(0编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示