迁移hive表及hive数据
公司hadoop集群迁移,需要迁移所有的表结构及比较重要的表的数据(跨云服务机房,源广州机房,目标北京机房)
1、迁移表结构
1)、老hive中导出表结构
1 | hive -e "use db;show tables;" > tables.txt |
1 2 3 4 5 6 7 | #!/bin/bash cat tables.txt | while read eachline do hive -e "use klwarehouse;show create table $eachline" >>tablesDDL.txt echo ";" >> tablesDDL.txt done |
2)、新hive中导入表结构
1 | hive -f tableDDL.txt |
对了,执行之前要先建立db,然后在tableDDL.txt前面加上use db;
2、迁移表数据
目前使用的方案是一个一个将表数据导出到HDFS,接着下载到云主机中,压缩,外网传到新的hive集群网络中的主机中,解压,上传至HDFS,上传至HIVE
1)、将HIVE表数据导出至HDFS
1 2 | hdfs dfs -mkdir /tmp/hive-export<br><br>use db; export table 表名 to /tmp/hive-export |
2)、将HDFS数据下载至主机中
1 | hdfs dfs -get /tmp/hive-export/ |
3)、将数据压缩
1 | tar -zcvf hivetable1.tar.gz hive-export |
4)、将数据发送至目标hive集群的内网主机中
1 | scp hivetable1.tar.gz root @x .x.x.x:/data |
5)、解压数据
1 | tar -zxvf hivetable1.tar.gz |
6)、将数据上传至HDFS中
1 | hdfs dfs -put hive-export/ /tmp/hive-export |
7)、将HDFS数据上传至Hive表中
1 2 | use db; import table 表名 from /tmp/hive-export |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 字符编码:从基础到乱码解决
2016-02-01 2016年2月计划1月总结
2016-02-01 记录sqoop同步失败问题解决过程,过程真的是很崎岖。(1月6日解决)