kettle工具教程

安装教程

1、下载(官网:https://community.hitachivantara.com/s/article/data-integration-kettle)

 

   稍后跳转5秒后就会自动下载

2、下载数据库链接驱动

sql:https://docs.microsoft.com/zh-cn/sql/connect/jdbc/download-microsoft-jdbc-driver-for-sql-server?view=sql-server-ver15

 

 

 mysql:https://dev.mysql.com/downloads/connector/j/

 

 

  

 解压后将相应jdk版本的驱动放入根目录下的lib文件夹即可。

 

kettle基础

  1、双击启动程序【Spoon.bat】

  2、创建DB,创建完后可点击【测试】验证是否创建成功

 

 

 

 

   3、创建转换

在【输入】中选择【表输入】,在输出中选择【插入/更新】

连线操作:单击表输入节点后,按住shift即可拖拉。单击连线会变灰,即取消该操作。

 

 

先选择数据库连接,sql语句可以自己写,也可以点击【获取sql查询语句】自动生成,写完后可点击【预览】查看查询数据,最后点击【确定】。

 

 【插入/更新】操作差不多。唯一提一点就是如果你偷懒点了【获取字段】,它将自动按输入的内容,加载所有字段,如果两个表字段名不一致,你还得手动重新选择

  4、保存本地后运行;

  

 

   5、转换没问题后可新建【作业】

  

 

   【start】双击后可设置循环周期参数,双击【转换】后选择之前运行时保存在本地的转换

  

kettle进阶

  1、DB连接共享

  

 作用:创建一次DB后,后面可直接拿来用,无需再次创建。

  2、资源库

  

 

 

 

 

 

 点击右上角的【connect】就会进入资源库选择页面。首先打开的是Pentaho自己的服务器,企业一般不会去使用,当然你也可以用。点击【other repositories】后有两个选择,第一个是数据库资源库,第二个是文件资源库。

区别:数据库会在库内创建40几张表(建议单独弄个库),需要用户名密码(admin/admin),库内DB连接与作业共享,方便多人合作;

  文件资源库会默认本地一个目录,再次打开时会直接访问该目录,本地操作,不需要网络,只能共享作业,DB还得额外点共享;

相同点:连接资源库之后,选打开作业只能选择资源库目录下的文件,无法访问整个硬盘。

注:创建资源库时,千万不要有任何中文字符!!!

 3、web管理

  a.打开服务:用管理员身份运行dos命令框,并进入kettle安装目录,接着运行命令

carte.bat 127.0.0.1 8022

  注:端口随便写,只要不冲突即可

  

 

   b.配置子服务器

 

 

 

 

   c.新增运行配置

 

 

   d、作业运行配置

 

 

  e、打开网页 127.0.0.1:8022

 用户名密码看

 

 

 

 

 常见错误

1、创建资源库中含有中文,导致无法显示connet或者管理操作;

下图中【repositories.xml】是资源库文件,打开后将中文内容去掉或者删除整个文件,重新创建资源库都行。

 

 2、Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.

编辑安装根目录下的【Spoon.bat】,打开后在如图位置上添加内容:-Dfile.encoding=UTF-8

 

 

Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.

posted @ 2021-05-11 14:16  疯狂阿坤  阅读(1270)  评论(0编辑  收藏  举报