用SQL语句的分组函数实现求取集合的大小
size(collect_set(case when COLUMN = column_value then column_1)
over (partition by column_2, column_3 order by column_4 desc)) as column_4
1、含义:先以column_2, column_3字段进行分组,然后查询满足“COLUMN = column_value”的数据,将字段column_1放到集合中(去重),
然后求取该集合的大小。
2、说明:该功能类似于count(distinct xxx),但是它不用group by语句,而是用分组函数来实现的。