kettle工具教程
安装教程
1、下载(官网:https://community.hitachivantara.com/s/article/data-integration-kettle)
稍后跳转5秒后就会自动下载
2、下载数据库链接驱动
mysql:https://dev.mysql.com/downloads/connector/j/
解压后将相应jdk版本的驱动放入根目录下的lib文件夹即可。
kettle基础
1、双击启动程序【Spoon.bat】
2、创建DB,创建完后可点击【测试】验证是否创建成功
3、创建转换
在【输入】中选择【表输入】,在输出中选择【插入/更新】
连线操作:单击表输入节点后,按住shift即可拖拉。单击连线会变灰,即取消该操作。
先选择数据库连接,sql语句可以自己写,也可以点击【获取sql查询语句】自动生成,写完后可点击【预览】查看查询数据,最后点击【确定】。
【插入/更新】操作差不多。唯一提一点就是如果你偷懒点了【获取字段】,它将自动按输入的内容,加载所有字段,如果两个表字段名不一致,你还得手动重新选择
4、保存本地后运行;
5、转换没问题后可新建【作业】
【start】双击后可设置循环周期参数,双击【转换】后选择之前运行时保存在本地的转换
kettle进阶
1、DB连接共享
作用:创建一次DB后,后面可直接拿来用,无需再次创建。
2、资源库
点击右上角的【connect】就会进入资源库选择页面。首先打开的是Pentaho自己的服务器,企业一般不会去使用,当然你也可以用。点击【other repositories】后有两个选择,第一个是数据库资源库,第二个是文件资源库。
区别:数据库会在库内创建40几张表(建议单独弄个库),需要用户名密码(admin/admin),库内DB连接与作业共享,方便多人合作;
文件资源库会默认本地一个目录,再次打开时会直接访问该目录,本地操作,不需要网络,只能共享作业,DB还得额外点共享;
相同点:连接资源库之后,选打开作业只能选择资源库目录下的文件,无法访问整个硬盘。
注:创建资源库时,千万不要有任何中文字符!!!
3、web管理
a.打开服务:用管理员身份运行dos命令框,并进入kettle安装目录,接着运行命令
carte.bat 127.0.0.1 8022
注:端口随便写,只要不冲突即可
b.配置子服务器
c.新增运行配置
d、作业运行配置
e、打开网页 127.0.0.1:8022
用户名密码看
常见错误
1、创建资源库中含有中文,导致无法显示connet或者管理操作;
下图中【repositories.xml】是资源库文件,打开后将中文内容去掉或者删除整个文件,重新创建资源库都行。
2、Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.
编辑安装根目录下的【Spoon.bat】,打开后在如图位置上添加内容:-Dfile.encoding=UTF-8
Unexpected error reading step information from the repository Invalid byte 1 of 1-byte UTF-8 sequence.
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· DeepSeek “源神”启动!「GitHub 热点速览」
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· 2 本地部署DeepSeek模型构建本地知识库+联网搜索详细步骤