上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 14 下一页
摘要: Kettle 是一款功能强大的开源 ETL 工具,被广泛应用于数据集成、数据转换和数据加载等领域。随着数据量和多样性的不断增加,使用 Kettle 进行数据处理已成为许多企业和数据工程师的首选。在过去的几个月里,我已经撰写了将近50篇关于 Kettle 的文章,涵盖了各种主题和用例,如数据抽取、数据 阅读全文
posted @ 2024-03-13 21:46 慕容尘轩 阅读(94) 评论(1) 推荐(1) 编辑
摘要: 一、Java中的基础数据类型有哪些? Java中的基本数据类型包括: 1. byte:8位有符号整数,范围为-128到127。2. short:16位有符号整数,范围为-32768到32767。3. int:32位有符号整数,范围为-2147483648到2147483647。4. long:64位 阅读全文
posted @ 2024-03-13 21:45 慕容尘轩 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 1、kettle插件是什么 kettle本身有足够多的转换或者job步骤,但是依然不能覆盖所有的业务场景,所以Kettle 自定义插件在有些独特的业务场景可以大显身手。 Kettle的插件架构使得我们可以不用修改Kettle本身代码,通过一些独立的代码就可以扩展Kettle的功能。这些独立的代码称为 阅读全文
posted @ 2024-02-28 21:05 慕容尘轩 阅读(296) 评论(0) 推荐(0) 编辑
摘要: 1、kettle自带的客户端spoon工具是cs架构,多人协同办公起来不是特别方便。当然spoon也可以通过文件仓库设置为database模式进行协同办公。每个人在自己电脑上安装&打开spoon客户端,然后设置相同的文件仓库地址。如下图所示。 2、Web-based Spoon(也称为webSpoo 阅读全文
posted @ 2024-02-28 20:38 慕容尘轩 阅读(748) 评论(0) 推荐(0) 编辑
摘要: 1、上一节课我们学习了mongo input读取步骤,本节课我们一起学习下mongo out 写入步骤,该步骤可以将数据写入到mongo中,如下图所示。 2、 配置mongo连接,有两种方式,如截图所示。 Connection String:如String connectionString = "m 阅读全文
posted @ 2024-02-23 22:44 慕容尘轩 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 1、kettle 9.3/9.4 spoon客户端中默认是没有redis步骤的,首先想到在kettle的插件市场进行下载redis步骤。 2、可能因为网络原因,直接下载失败了。索性放弃redis原有插件步骤,改为自己通过java代码进行实现,(有java基础的可以通过java代码步骤结合自定义jar 阅读全文
posted @ 2024-02-21 21:31 慕容尘轩 阅读(304) 评论(0) 推荐(0) 编辑
摘要: 1、我们平常在写应用程序的时候,会有去重的业务场景,可以在数据库层面解决,也可以在内存层面解决。 同样kettle也有去重的步骤【唯一行(哈希值)】和【去除重复记录】 唯一行(哈希值):使用 HashSet 来删除重复行,只保留唯一的行。 去除重复记录(Unique Rows):删除重复行,只保留唯 阅读全文
posted @ 2024-02-21 10:50 慕容尘轩 阅读(341) 评论(0) 推荐(0) 编辑
摘要: 1、上一节课我们学习了1对多表拆分数据同步,本节课我们一起学习多对1数据同步,也就是说多张表关联之后的结果集写入一张表。 我们平常在写java应用的时候多表关联一般有两种方式: a、通过sql 语句的join 进行关联。 b、将多个表的数据集加载到内存中通过java代码进行关联。 同样在kettle 阅读全文
posted @ 2024-02-20 09:27 慕容尘轩 阅读(453) 评论(0) 推荐(0) 编辑
摘要: 1、在有的业务场景中,会涉及一对多表拆分同步的业务场景,也就是说原表是一张表,将原表字段进行拆分放入目标库中的多张表,如下面的示例将表student_third中的数据 同步到student、teacher 两张表。 数据源表student_third CREATE TABLE `student_t 阅读全文
posted @ 2024-02-19 08:37 慕容尘轩 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 1、上一课我们学习了在数据量大的情况下的分页全量同步示例,本次我们一起学习下kettle 增量全量同步。有些业务场景不需要实时数据,比如每N分钟抽取一次数据等。 2、kettle增量全量同步示例依然基于test数据库,从t1表增量同步数据到t2表,假定每N(这里的N可以根据业务场景自定义job触发频 阅读全文
posted @ 2024-02-05 15:29 慕容尘轩 阅读(773) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 14 下一页