2013年4月18日

Hive分组提取TopN操作

摘要: 今天在测试摄影部落做关联规则推荐的效果这种推荐不能算是个性化推荐,因为只要前件项目固定了,推荐列表就是固定的,推荐的结果不会跟着人走最终会成表一张规则表Table(Item_a, Item_b, Rel)其中Rel表示俩个项目之间的关系强弱为了给每个项目生成一张推荐列表,则必须按照关系强弱做分组TopN操作Hive的基础SQL没办法满足需求,只能自己写UDAF和UDTF了View Code package Item;import java.util.ArrayList;import java.util.Collections;import java.util.Comparator;import 阅读全文

posted @ 2013-04-18 17:00 JueFan_C 阅读(2470) 评论(0) 推荐(0) 编辑

导航