2014年3月6日

hive UDAF开发入门和运行过程详解(转)

摘要: 介绍hive的用户自定义聚合函数(UDAF)是一个很好的功能,集成了先进的数据处理。hive有两种UDAF:简单和通用。顾名思义,简单的UDAF,写的相当简单的,但因为使用Java反射导致性能损失,而且有些特性不能使用,如可变长度参数列表。通用UDAF可以使用​​所有功能,但是UDAF就写的比较复杂,不直观。本文只介绍通用UDAF。UDAF是需要在hive的sql语句和group by联合使用,hive的group by对于每个分组,只能返回一条记录,这点和mysql不一样,切记。UDAF开发概览开发通用UDAF有两个步骤,第一个是编写resolver类,第二个是编写evaluator类。re 阅读全文

posted @ 2014-03-06 11:21 JueFan_C 阅读(1210) 评论(0) 推荐(0) 编辑

导航