spoon新手入门教程

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

kettle的最新下载地址:http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/6.0/pdi-ce-6.0.1.0-386.zip

  1. 此软件运行需要JDK环境,所以电脑没装JDK的话,先下载安装。
  2. Kettle解压到英文路径的文件夹中就可以了,不需要安装。
  3. 点击data-integration文件夹中的Spoon.bat就能打开了。

下面是图文教程:

进入解压的目录,找到Spoon.bat,先别着急双击打开,如果你本机的数据库是oracle,就先把oracle的驱动放进spoon解压目录的lib目录下;如果本机装的是mysql数据库,同理把mysql的驱动放到lib目录下,然后再启动spoon。否则当你启动的时候会报如下错误

Driver class 'oracle.jdbc.driver.OracleDriver' could not be found, make sure the 'Oracle' driver (jar file) is installed.
oracle.jdbc.driver.OracleDriver
  • 1
  • 2

这里写图片描述

这里写图片描述

打开spoon后点击左上角的主对象树,右键DB连接新建。

这里写图片描述

输入数据库连接信息

这里写图片描述

输入完成后先点击测试一下,看看连接是否正常。

这里写图片描述

下面开始新建转换。

这里写图片描述

点开左侧栏的输入,找到表输入,并用鼠标把表输入拖向右边空白区域。

这里写图片描述

这里写图片描述

双击拖进来的表输入,编辑表输入里面的信息。

这里写图片描述

点开左侧栏的输出,找到插入/更新,并用鼠标把插入/更新拖向右边空白区域。
这里写图片描述

摁住shift键不放,鼠标点击表输入,然后拖向旁边的插入/更新,这样就把两个动作连接起来了。

这里写图片描述

双击插入/更新,编辑插入/更新里面的信息。最后把该转换保存,这里保存成test.ktr。

这里写图片描述

接下来开始创建作业

这里写图片描述

创建作业和创建转换操作都差不多。

这里写图片描述

双击START,对START进行编辑,可以让作业按每天、每周、每月定时调用。

这里写图片描述

双击装换进行编辑,找到前面保存的test.ktr 转换文件。

这里写图片描述

到这一步就可以开始点击运行了

这里写图片描述

下图是运行结果

这里写图片描述

tb_user是源表

这里写图片描述

tb_user2是目标表,没运行作业前它是没有数据的。

这里写图片描述

运行作业后,数据成功导入到tb_user2表里。
这里写图片描述

根据上面的教程,可以尝试着把oracle数据库中的表的数据插入到mysql等其它数据库中的表里面去。

posted @ 2020-12-11 11:19  小寒2020  阅读(2368)  评论(1编辑  收藏  举报