摘要: 数仓面试重灾区-Generic User-defined Table Generating Function UDTF 这玩意对数仓同学来讲,熟悉又陌生,主要一方面是大量接触,另一方面是理解上有误导,还一个就是不是太明白里头到底咋回事。 场景切入 关于UDTF面试场景大概有以下的问题:1、hive的 阅读全文
posted @ 2021-11-07 21:28 小阿政 阅读(935) 评论(0) 推荐(0) 编辑
摘要: 连续登录问题: 实现思路: 1.因为每天用户登录次数可能不止一次,所以需要先将用户每天的登录日期去重。 2.再用row_number() over(partition by _ order by _)函数将用户id分组,按照登陆时间进行排序。 3.计算登录日期减去第二步骤得到的结果值,用户连续登陆情 阅读全文
posted @ 2021-11-07 20:41 小阿政 阅读(432) 评论(0) 推荐(0) 编辑