hive中的列转行和行转列

https://www.cnblogs.com/zzhangyuhang/p/9791795.html

https://www.cnblogs.com/blogyuhan/p/9274784.html

列转行:
user_id order_id 104399 1715131 104399 2105395 104399 1758844 104399 981085 104399 2444143 104399 1458638 104399 968412 104400 1609001 104400 2986088 104400 1795054

把相同user_id的order_id按照逗号转为一行:select user_id,concat_ws(',',collect_list(order_id)) as order_value from col_lie group by user_id

 

 使用方法

 

UDTF有两种使用方法,一种直接放到select后面,一种和lateral view一起使用。

 

 1:直接select中使用

 

select explode_map(properties) as (col1,col2) from src;

 

不可以添加其他字段使用

 

select a, explode_map(properties) as (col1,col2) from src

 

不可以嵌套调用

 

select explode_map(explode_map(properties)) from src

 

不可以和group by/cluster by/distribute by/sort by一起使用

 

select explode_map(properties) as (col1,col2) from src group by col1, col2

 

 

2:和lateral view一起使用

 

select src.id, mytable.col1, mytable.col2 from src lateral view explode_map(properties) mytable as col1, col2;

 

此方法更为方便日常使用。执行过程相当于单独执行了两次抽取,然后union到一个表里。

 

行转列:

user_id    order_value
104408    2909888,2662805,2922438,674972,2877863,190237
select user_id,order_value,order_id
from lie_col
lateral view explode(split(order_value,',')) num as order_id
limit 10;
posted @ 2019-08-29 11:39  hulifang  阅读(690)  评论(0编辑  收藏  举报