datax rdbmsreader 添加mysql、oracle驱动
【引用下官方说明】
RDBMS Reader是一个通用的关系数据库读插件,您可以通过添加、注册数据库驱动等方式增加各种关系型数据库的读支持。
本文为您介绍如何通过RDBMS Reader添加关系型数据库驱动。
一、前提条件
在添加关系型数据库驱动前,您需要购买ECS服务器作为您的自定义资源组,建议购买规格如下:
- 使用CentOS 6、CentOS 7或AliyunOS。
- 如果您添加的ECS需要执行MaxCompute任务或同步任务,需要检查当前ECS的python版本是否为Python2.6或2.7的版本(CentOS 5的Python版本为2.4,其它OS自带2.6以上版本)。
- 以是否能够ping通www.aliyun.com作为衡量标准,确认ECS可以访问公网。
- 建议ECS的配置为8核16G。
二、背景信息
RDBMS Reader通过JDBC连接器连接至远程的RDBMS数据库,并根据您配置的信息生成查询SQL语句,发送至远程RDBMS数据库,执行该SQL并返回结果。然后使用数据同步自定义的数据类型拼装为抽象的数据集,传递给下游Writer处理。详情请参见RDBMS Reader。
三、添加自定义资源组
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 单击相应工作空间后的进入数据集成。
- 如果您已在DataWorks的某个功能模块,请单击左上角的图标,选择全部产品 > 数据集成,即可跳转至数据集成页面。
- 在左侧导航栏,单击自定义资源组,进入自定义资源组管理页面。
- 单击右上角的新增自定义资源组。
- 安装Agent并初始化,详情请参见新增自定义数据集成资源组。
- 待服务器状态为可用时,则成功添加自定义资源组。
- 如果刷新后还是停止状态,请切换至admin账号,执行下述命令重启alisa。
/home/admin/alisatasknode/target/alisatasknode/bin/serverct1 restart
四、添加MySQL驱动
- 进入rdbmsreader目录下的libs子目录,上传您下载的MySQL JAR包。
五、配置数据同步任务
目前RDBMS Reader仅支持通过脚本模式配置同步任务,配置示例如下。
{ "job": { "setting": { "speed": { "byte": 1048576 }, "errorLimit": { "record": 0, "percentage": 0.02 } }, "content": [ { "reader": { "name": "rdbmsreader", "parameter": { "username": "xxxxx", "password": "yyyyyy", "column": [ "*", ], "splitPk": "id", "connection": [ { "table": [ "a2" ], "jdbcUrl": [ "jdbc:mysql://xxx.mysql.yy.aliyuncs.com:3306/xxx" //直接配置您的SQL地址。 ] } ], "where": "" } }, "writer": { //writer部分根据您的需要进行配置即可。 "name": "streamwriter", "parameter": { "print": true } } } ] } }
诸业皆是自作自受,休咎祸福,尽从心生。