Hive累加,日期缺失问题处理方式
最近一位大哥问了一个问题,Hive进行数据清洗时,如果计算累加,并且把缺失的日期带上,最初想的是构造一个中间时间表,然后进行关联,发现特别麻烦,后面想到的大致思路就是使用sum over+视图解决这个问题。
简单说就是想把图一的数据统计出图二的数据。
图一
图二
具体SQL关注公众号《码农独白》查阅:
最近一位大哥问了一个问题,Hive进行数据清洗时,如果计算累加,并且把缺失的日期带上,最初想的是构造一个中间时间表,然后进行关联,发现特别麻烦,后面想到的大致思路就是使用sum over+视图解决这个问题。
简单说就是想把图一的数据统计出图二的数据。
图一
图二
具体SQL关注公众号《码农独白》查阅: