摘要: Hadoop技术内幕中指出Top K算法有两步,一是统计词频,二是找出词频最高的前K个词。在网上找了很多MapReduce的Top K案例,这些案例都只有排序功能,所以自己写了个案例。这个案例分两个步骤,第一个是就是wordCount案例,二就是排序功能。一,统计词频 1 package TopK;... 阅读全文
posted @ 2014-05-20 16:04 潇洒子弦 阅读(6234) 评论(2) 推荐(1) 编辑
我的邮箱:keepmovingzx@163.com