kettle学习(1)

Kettle作用

Kettle是一种ETL(抽取,加载,转换)工具,使用图形界面的方式进行数据转换。

 

 

Kettle安装

 

安装下载Kettle 下载路径:

http://community.pentaho.com/projects/data-integration/

下载pdi-ce-6.1.0.1-196.zip

建议不要使用最新版本的包

 

Kettle使用:

解压上述的资源包,启动Spoon.bat文件。

启动可能出错:

解决方法:

Ketttle的Spoon脚本中,默认是PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m"。而2048是超过32bit的最大值,将PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx1024m"。

 

Kettle用过的术语

Sqoon:kettle的设计器

 

Kettle使用:

连接数据库:

会出现的问题:提示连接数据库加载驱动失败或者连接失败

Kettle默认是没有mysql数据库jar包的,需要添加Mysql驱动jar包  添加位置:pdi-ce-6.1.0.1-196\data-integration\lib和pdi-ce-6.1.0.1-196\data-integration\Data Service JDBC Driver目录下。Oracle的jar包同理

 

遇到的问题,在转化的过程中,如果数据源的数据存在空值,转换失败,解决方法如下:

在D:\Users\ex-hudashu\.kettle目录中找到kettle.properties文件,增加:

KETTLE_EMPTY_STRING_DIFFERS_FROM_NULL=Y

重启Kettle

posted on 2017-04-05 16:20  hudashu  阅读(396)  评论(0编辑  收藏  举报

导航