kylin跑增量一些问题

kylin版本:2.2.0

kylin正常按照日期做每日增量时
例如跑2020-06-14到2020-06-15数据的增量
1 python /ddhome/usr/kylin_client_tool/kylin_client_tool.py -P jkd -M BUILD -C radacct_time_duration_dist_community_424 -T 2020-06-14 -E 2020-06-15

 

 
kylin的增量方式是,如果之前的最后segment2020-06-08-2020-06-09的(比如因为一些原因失败或者中断了),则kylin实际会从2020-06-09跑到2020-06-15的增量
 
如果最后segment2020-06-08-2020-06-15的,或者正常build2020-06-14到2020-06-15失败后重试,则kylin生成这种2020-06-15_2020-06-15的segment,这种segment实际上又是再次跑全量的segment跑导致存储空间浪费或者因为资源不够跑任务失败。需要discard任务,再drop掉任务,去除掉错误的segment后,再重新跑任务。
 
 
 
 
如果要重新跑全量,则需要先disable cube,purge(即清空所有segment),再重跑全量。
 curl --user ${KYLIN_USER}:${KYLIN_PASSWD} -X PUT -H "Content-Type: application/json" ${KYLIN_API_URL}/cubes/${CUBE_NAME}/disable    
printf '\t--[2.purge cube %s]\n' ${CUBE_NAME}
curl --user ${KYLIN_USER}:${KYLIN_PASSWD} -X PUT -H "Content-Type: application/json" ${KYLIN_API_URL}/cubes/${CUBE_NAME}/purge

 

 
posted @ 2020-06-15 17:51  夏天换上冬装  阅读(397)  评论(0编辑  收藏  举报