kettle从入门到精通 第三十三课 再谈 kettle 表输出 分区/分片

1、之前第九章有讲过kettle 表输出步骤,里面有简单的提到过表输出步骤里面的表分区设置,这里详细介绍下。

  表分区数据:选择此选项可根据“分区”字段中指定的日期字段的值将数据拆分到多个表中。选择此选项后,数据将插入到表中,这些表的名称遵循<target table>_<date format>模式,如trade_info_20240101。在运行转换之前,必须手动创建这些表,以便在这些表中插入数据。

 分区字段:指定要用于确定如何在多个表中拆分值的日期字段。此值用于生成要插入数据的日期表名称。

 每个月分区数据和每天分区数据是互斥的,只能二选一,分区表需要自行创建哦,参考如下截图

2、分区表需要提前手动创建,不然会提示如下错误。

 

3、分区字段的类型一定需要时日期类型的,不然会提示如下错误

 

 4、若表中的分区字段不是日期类型,也可以通过kettle相关步骤(如javascript)转换为日期类型的字段供表输出使用,也可以达到同样的效果

提前创建好分区表以及正确设置分区字段类型之后正常运行,如下所示

 

 

 

 

 5、上面提到的表分区仅仅是简单的日期切片,如果想实现更复杂的分片策略,自己利用kettle步骤自定义设计灵活实现即可。

 

 

posted @ 2024-01-23 15:02  慕容尘轩  阅读(130)  评论(0编辑  收藏  举报