初识Kettle.
简介:
kettle是开源的java开发的etl工具,官网为:Home - Hitachi Vantara从官网下载后解压后点击Spoon.bat即可运行. 如果要连接mysql.MongoDB等数据库则需要下载相关驱动.
Win10环境演示:
例1:
kettle的运行模式是先设置转换模式,然后运行转换. 首先点击主对象树的转换,然后在转换中点击核心对象.
然后在输入中找到文本文件输入
双击后即可将其添加到页面中. 然后在核心对象的流程中找到过滤记录.将其添加.之后再将输出中的Excel输出添加.
如下图所示:
(当按住shift时点击模块可以添加模块与模块之间的连接,右键点击连接可以使其失效或删除.)
然后双击文本文件输入,将想要处理的文件添加.
然后再字段中点击获取字段结果如下(获取字段时kettle会自动分析文件的内容从而自动添加字段,当然也可以手动输入设置字段):
例如文件内容如下图:
然后双击过滤记录: 把条件设置如下
然后双击Excel输出设置输出文件位置和字段:
所有的都设置完成后点击运行转换:
可以在相应的路径去查看转换信息或直接右键单击Excel输出点击preview去查看. 当然在设置转换路径的时候也可以不加过滤模块或是使其失效,直接进行转换.
例2:
将Excel表转换到MySQL数据库中: 首先在主对象中点击db连接找到mysql数据库然后填入相关的库和用户信息:
然后点击测试如果成功了点击确定. 然后在核心对象中分别找到Excel输入和表输出.
表输入的设置和例1相似,也是设置路径和字段.表输出的设置需要输入连接名和库名以及表名:
然后点击运行转换即可.
例2如果想要成功连接数据库需要先下载驱动,并放置在lib目录下,附上kettle及mysql驱动下载链接.
链接:正在上传…重新上传取消pan.baidu.comhttps://link.juejin.cn/?target=https%3A%2F%2Fpan.baidu.com%2Fs%2F1pMTVVVYixXhRIE9cCsMkxw%3Fpwd%3Dmono
提取码:mono