Kettle入门--作业和转换的使用
本来想在centos7下部署的,发现因为java版本的问题,无法成功部署,无奈,转到windows平台(后来找到解决方法了,在centos7系统下yum install webkitgtk* -y 就可以了,注意执行spoon.sh时需要在桌面环境下执行,我直接在xshell下执行,会报错,无法弹出图形界面)
下载地址
https://jaist.dl.sourceforge.net/project/pentaho/Pentaho%208.0/client-tools/pdi-ce-8.0.0.0-28.zip
另外必需部署好java环境
解压,需要把mysql连接的jar文件放到lib文件夹下
启动spoon
点击spoon.ba即可
先新建一个转换:文件-》新建-》转换
开始新建数据库连接:选中DB连接右键-》新建
把DB连接下面的两个数据库,直接拖曳到右边(里面的test表和linux表都是我自己创建的)
其中那个箭头是选中表输入后,按住shift键,连接到表输出
最后,点击执行,作业1标签(这个只是用来说明位置)下的倒三角运行按钮
查看linux表,有新插入的数据
效果
上面是转换的使用,现在我们来试一下作业的使用。作业具体用处不是很清楚,我只是用到了其中一个定时执行的作用,下面来看一下例子(效果是每分钟执行以下上面的转换,zh.ktr是上面的转换执行时提示的保存位置)
看一下有没有成功自动执行(本来只有几条数据,然后跑了一晚上,直接变成两千多条)