kettle 基础2

1.Excel输出、Microsoft Excel输出

Excel输出只支持xls格式

Microsoft Excel支持xls以及xlsx格式

当数据量比较大时,选择xlsx并切勾选Stream XSLX data速度会比较快

2.数据库连接

数据库连接建立好之后,右键选择共享,那么每个转换就不用重复建立数据库连接了。

3.sql文件输出

生成insert 语句,支持先创建建表语句再insert

4.更新

查询不到的数据会失败,勾选忽略查询失败即可

5.插入更新

数据存在则更新,不存在则插入

6.删除

删除数据库指定的数据

7.自定义常量数据

在元数据标签指定常量名称以及数据类型,在数据一栏指定数据的值

8.contect fields

separator中指定连接字符,target field name指定新生成的字段名称

 

 

 

 

 9.值映射

值映射就是把字段的一个值映射成其他值

10.增加常量

增加常量就是在本身的数据流里添加一列数据,该列数据都是相同的值

11.增加序列(seq)

增加序列是给数据流添加一个序列字段

其中,使用数据库增加序列只有oracle支持

12.字段选择

字段选择是从流中选择字段、改变名称、修改数据类型(在元数据模块)。

13.计算器

计算器是一个函数集合来创建新的字段,还可以设置字段是否移除(临时字段)。

14.剪切字符串:输入流字段裁剪的位置剪切出新的字段

     字符串替换:指定搜索内容和替换内容,如果输入流字段匹配上搜索内容就进行替换成新字段

     字符串操作:去除字符串两端空格和大小写切换,并生成新的字段。

15.去除重复记录(注:使用之前必须先进行排序)

     排序记录:按照指定的字段升序或降序对数据流排序

 

posted @ 2020-07-23 21:36  renzy194  阅读(228)  评论(0编辑  收藏  举报