摘要:
数仓面试重灾区-Generic User-defined Table Generating Function UDTF 这玩意对数仓同学来讲,熟悉又陌生,主要一方面是大量接触,另一方面是理解上有误导,还一个就是不是太明白里头到底咋回事。 场景切入 关于UDTF面试场景大概有以下的问题:1、hive的 阅读全文
摘要:
连续登录问题: 实现思路: 1.因为每天用户登录次数可能不止一次,所以需要先将用户每天的登录日期去重。 2.再用row_number() over(partition by _ order by _)函数将用户id分组,按照登陆时间进行排序。 3.计算登录日期减去第二步骤得到的结果值,用户连续登陆情 阅读全文