kettle从入门到精通 第十三课 kettle 字符串操作
1、本次示例讲解一些常用的字符串操作,有字段拼接,枚举值转换,计算器、字符串替换、字段拆分。
2、输入元数据有firstName、secondName、sex、salary、englishName、others。
3、拼接字段步骤,其作用是把多个字段合并为一个新的字段
1)步骤名称:可自定义
2)Target Field Name:目标/新字段名称
3)Length of Target Field:目标/新字段数据长度
4)Separator:字段拼接在一起的分隔符,如逗号,分号等
5)Enclosure:一对可以包裹字段的字符串,如双引号,单引号等
6)高级:更多配置参考 https://pentaho-public.atlassian.net/wiki/spaces/EAI/pages/386803438/Concat+Fields
4、值映射步骤,其作用是处理枚举值转换
1)步骤名称:可自定义
2)使用的字段:从前一个步骤输入的字段中选取
3)目标字段名(空=覆盖):可以自定义哥目标字段,若为空,则替换原始字段的值
4)不匹配时的默认值:当输入的数据不匹配枚举列表时给出默认值设置
5)字段值:枚举转换列表设置
5、计算器步骤,其作用根据预设的一些规则对多个字段进行运算,本示例是将englishName字段值转成大写字母。
5、字符串替换步骤,其作用是和java里面的replace一样,本示例是通过正则表达式将数字替换为***
6、拆分字段步骤,其作用是将一个字段拆分为多个字段,本示例将others字段拆分为tel和address,类似java里面的split
1)步骤名称:可自定义
2)需拆分的字段:从输入步骤字段中选择
3)分隔符:比如常见的逗号,分号,空格等
4)用一对指定的字符串将字段括起来。如果要在字段中使用分隔符,请使用此选项。
5)更多配置参考https://help.hitachivantara.com/Documentation/Pentaho/9.3/Products/Split_Fields