2014年3月13日

Hive UDAF开发之同时计算最大值与最小值

摘要: 卷首语前一篇文章hive UDAF开发入门和运行过程详解(转)里面讲过UDAF的开发过程,其中说到如果要深入理解UDAF的执行,可以看看求平均值的UDF的源码本人在看完源码后,也还是没能十分理解里面的内容,于是动手再自己开发一个新的函数,试图多实践中理解它函数功能介绍函数的功能比较蛋疼,我们都知道Hive中有几个常用的聚合函数:sum,max,min,avg现在要用一个函数来同时实现俩个不同的功能,对于同一个key,要求返回指定value集合中的最大值与最小值这里面涉及到一个难点,函数接收到的数据只有一个,但是要同时产生出俩个新的数据出来,且具备一定的逻辑关系语言描述这东西我不大懂,想了好久, 阅读全文

posted @ 2014-03-13 12:23 JueFan_C 阅读(3237) 评论(1) 推荐(0) 编辑

导航