hive group by distinct区别以及性能比较
摘要:Hive去重统计 相信使用Hive的人平时会经常用到去重统计之类的吧,但是好像平时很少关注这个去重的性能问题,但是当一个表的数据量非常大的时候,会发现一个简单的count(distinct order_no)这种语句跑的特别慢,和直接运行count(order_no)的时间差了很多,于是研究了一下。
阅读全文
posted @ 2019-11-05 11:47
posted @ 2019-11-05 11:47
posted @ 2019-09-02 13:31
posted @ 2019-08-26 20:40
posted @ 2019-06-28 11:44
posted @ 2019-06-20 11:50
posted @ 2019-06-14 22:22