005.hive分组求中位数--sort_array(collect_list(),insert overwrite table --- 实现字段update操作

复制代码
    select 
     occur_period 
     ,arr_1
     ,case when size(arr_1)%2=1  then arr_1[cast((size(arr_1)-1)/2 as int )]
       else (arr_1[cast(size(arr_1)/2 as int) ]+arr_1[cast(( size(arr_1)/2-1 )as int)])/2 
       end as zws_1
     ,case when size(arr_2)%2=1  then arr_2[cast((size(arr_2)-1)/2 as int )]
       else (arr_2[cast(size(arr_2)/2 as int) ]+arr_2[cast(( size(arr_2)/2-1 )as int)])/2 
       end as zws_2
    from 
    (    
     select 
     occur_period 
     , sort_array(collect_list(num_jdz_1)) as arr_1
     , sort_array(collect_list(num_jdz_2)) as arr_2
     from 
     qhtest.num_zws_update_test
     group by occur_period
    )a
复制代码

 

自带的中位数函数是去重求中位数

小数 percentile_approx
 
select percentile_approx( i_de_js, 0.5) from qhtest.test_table_zws;  

posted @   star521  阅读(527)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 一文读懂知识蒸馏
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
点击右上角即可分享
微信分享提示