摘要: 安装前置要求 Linux 使用Centos7 JDK ( 1.8 以上 ) Python ( 2.6 以上 ) Centos7 默认安装了Python 2.7 1、访问官网下载安装包 http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax 阅读全文
posted @ 2021-06-18 23:45 Tenic 阅读(546) 评论(0) 推荐(0) 编辑
摘要: 1、DataX 基本介绍 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具,致力于实现包括:关系型数据库(MySQL、Oracle等)、HDFS、Hive、HBase、ODPS、FTP等各种异构数据源之间稳定高效的数据同步功能。 设计理念 为了解决异构数据源同步问题,DataX将复杂的网状的 阅读全文
posted @ 2021-06-18 23:39 Tenic 阅读(1626) 评论(0) 推荐(0) 编辑
摘要: 将数据从HDFS把文件导出到RDBMS数据库 导出前,目标表必须存在于目标数据库中。 默认操作是从将文件中的数据使用INSERT语句插入到表中 更新模式下,是生成UPDATE语句更新表数据 数据是在HDFS当中的如下目录/sqoop/emp,数据内容如下 1201,gopal,manager,500 阅读全文
posted @ 2021-06-18 00:10 Tenic 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 1. 列举出所有的数据库 命令行查看帮助 sqoop help 列出hadoop02主机所有的数据库 sqoop list-databases --connect jdbc:mysql://hadoop02:3306/ --username root --password 123456 查看某一个数 阅读全文
posted @ 2021-06-18 00:03 Tenic 阅读(152) 评论(0) 推荐(0) 编辑