摘要: 一、概述 kettle中3个重要的步骤: 子转换/映射 在转换里调用一个子转换,便于封装和重用。 集群 集群模式 变量和参数 变量和参数的用法 二、子转换 1.定义子转换 主要由映射输入与映射输出定义: 这里给出一个从kettle自带的samples中拿出来的示例,详情配置,参考kettle示例 保 阅读全文
posted @ 2018-06-24 14:42 H.U.C-王子 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 一、概述 查询步骤: 用来查询数据源里的数据并合并到主数据流中 。 连接步骤: 结果集通过关键字进行连接 。(与前面的UNION不同) 二、查询步骤 1.流查询 流查询示例:(注意上文中的流查询的限制) // 带有i的流向表示是信息流 2.数据库查询 数据库查询配置示例: 3.web查询 // 相关 阅读全文
posted @ 2018-06-24 11:25 H.U.C-王子 阅读(853) 评论(0) 推荐(0) 编辑
摘要: 一、概述 流程主要用来控制数据流程与数据流向 应用则是提供一些工具类 二、流程步骤 1.ETL元数据注入 类似Java中的反射,在设计时不知道文件名、文件位置等,在真正执行时才知道具体的一些配置等信息 具体介绍后续补充,官方Wikia:https://wiki.pentaho.com/display 阅读全文
posted @ 2018-06-24 10:31 H.U.C-王子 阅读(1126) 评论(0) 推荐(0) 编辑
摘要: 一、概述 转换步骤分类: 1. 增加新的列 2. 字符串处理 3. 行列变换 4. 排序/排重/字段选择 5. 其他转换步骤 二、增加新的列 1.增加常量列 增加一列常量的列 其它增加列的操作大同小异,不一一赘述,只介绍计算器 2.计算器 可以进行数值运算、日期运算等... 更多计算类型的介绍,参见 阅读全文
posted @ 2018-06-24 09:49 H.U.C-王子 阅读(765) 评论(0) 推荐(0) 编辑