阿里云OSS迁移bucket（政务云迁移至公共云）🥥

使用ossimport迁移数据

官网操作文档

ossimport有单机模式和分布式模式两种部署方式。

单机模式：当您需要迁移的数据小于30 TB时，推荐部署单机模式。您可以将ossimport部署在任意一台可以访问您待迁移数据，且可以访问OSS的机器上。
分布式模式：当您需要迁移的数据大于30 TB时，推荐部署分布式模式。您可以将ossimport部署在任意多台可以访问您待迁移数据，且可以访问OSS的机器上。

下面介绍单机模式部署：

前提条件

已安装Java 1.7或Java 1.8。

快速使用

1.下载ossimport-2.3.7.zip并解压。

解压后的文件结构如下：

ossimport
├── bin
│   └── ossimport2.jar  # 包括Master、Worker、TaskTracker、Console四个模块的总jar
├── conf
│   ├── local_job.cfg   # Job配置文件
│   └── sys.properties  # 系统运行参数配置文件
├── console.bat         # Windows命令行，可以分布执行调入任务
├── console.sh          # Linux命令行，可以分布执行调入任务
├── import.bat          # Windows一键导入，执行配置文件为conf/local_job.cfg配置的数据迁移任务，包括启动、迁移、校验、重试
├── import.sh           # Linux一键导入，执行配置文件为conf/local_job.cfg配置的数据迁移任务，包括启动、迁移、校验、重试
├── logs                # 日志目录
└── README.md           # 说明文档，强烈建议使用前仔细阅读

2.根据需求编辑conf/sys.properties、conf/local_job.cfg文件。

将ossimport工具解压后，进入conf目录，修改local_job.cfg文件对应内容

要修改的字段：

srcPrefix=留空

注意不要修改以下内容：

conf/sys.properties中的配置项workingDir、workerUserName、workerPassword、privateKeyFile。
conf/local_job.cfg的名称、位置、配置项jobName。

配置示例请参见配置文件示例。

3.配置完成后运行任务。

Window系统下在双击运行import.bat。
Linux终端中执行bash import.sh命令。

[root@localhost ossimport-2.3.7]# bash import.sh

运行方式

单机模式下，数据迁移任务有以下两种执行方式：

一键导入
分步执行

这里选择一键导入方式：

一键导入：是对所有步骤的封装，按照脚本提示执行即可完成数据迁移。快速使用步骤使用的是这种执行方式，对于初级用户建议使用一键导入。
1. 执行一键导入。
  - Window系统下在双击运行import.bat。
  - Linux终端中执行bash import.sh命令。
  说明
  
  如果之前执行过程序，会提示是否从上次的断点处继续执行，或者重新执行同步任务。对新的数据迁移任务，或者修改了同步的源端/目的端，请选择重新执行。
2. Windows下任务开始后，会打开一个新的cmd窗口执行同步任务并显示日志，旧窗口会每隔10秒打印一次任务状态，数据迁移期间不要关闭两个窗口；Linux下服务在后台执行。
3. 当Job完成后，如果发现有任务失败了，会提示是否重试。输入y重试，输入n则跳过退出。
4. 如果上传失败，请查看master/jobs/local_test/failed_tasks/<taskid>/audit.log文件，确定失败原因。

posted @ 2024-06-28 14:58 Noleaf 阅读(56) 评论(0) 编辑收藏举报

刷新页面返回顶部

nagao

阿里云OSS迁移bucket（政务云迁移至公共云）🥥

阿里云OSS迁移bucket（政务云迁移至公共云）🥥

使用ossimport迁移数据

下面介绍单机模式部署：

前提条件

快速使用

运行方式

公告