Kettle实现SQL Server数据到GreenPlum的每日同步调度

1.总的调度流程,通过linux下的crontab定时执行一个包含kjb执行信息的shell脚本

 

2.XXXX_0_Execute_Judge转换下有两个作业,通过获取每天的同步状态值来判断是否执行同步工作,如果同步状态不满足,会发邮件告知

 

3.XXXX_A0_Connect_Next作业下含有四个并行执行的作业,Message_Prepare_Yes作业负责的获取到同步状态OK的Email邮件通知

 

4.四个并行执行的作业分别负责同步不同的模块数据(整个同步原则是小表直接同步,大表通过BCP导出,映射成GP对应的utf-8的txt外部表)

 

 

 

5.在所有的模块成功执行完成后,会发送同步完成的邮件通知

 

以上只是记录ETL项目的整理框架流程,整个过程比较复杂的地方在于超过十几个G的大表压缩传送,GBK到UTF-8的转码。

 

posted on 2017-07-30 20:57  BingCorePower  阅读(2729)  评论(0编辑  收藏  举报

导航