07 2021 档案
摘要:数据开发很多时候由于文档缺失等原因导致不记得一个表哪个字段或者某几个字段构成的主键,不清楚主键很麻烦,我们就不清楚怎么去和其他的表进行关联,或者有些公司各种不规范,需求过来连产品自己都不清楚的情况,那么这个时候就只有开发自己去梳理了(苦逼的数据开发),本文主要是写了一个小工具用于根据数据检测出主键。
阅读全文
摘要:今天又来练习一个sql,如何把多个条数据按照时间交集合并为一条,没有想到好的方法,稍微有点复杂,大致思路就是自关联表数据,由于如果有交集的数据关联后会出现多次,把这种出现多次的数据合并为一个集合,再从集合里面选出最大和最小日期,然后另一部分数据没有交集,只出现过一次,最后把两部分数据合并到一起就可以
阅读全文
摘要:最近一位大哥问了一个问题,Hive进行数据清洗时,如果计算累加,并且把缺失的日期带上,最初想的是构造一个中间时间表,然后进行关联,发现特别麻烦,后面想到的大致思路就是使用sum over+视图解决这个问题。 简单说就是想把图一的数据统计出图二的数据。 图一 图二 具体SQL关注公众号《码农独白》查阅
阅读全文