摘要: 一、问题背景 倒排索引其实就是出现次数越多,那么权重越大,不过我国有凤巢....zf为啥不管,总局回应推广是不是广告有争议... eclipse里ctrl+t找接口或者抽象类的实现类,看看都有啥方法,有时候hadoop的抽象类返回的接口没有需要的方法,那么我们返回他的实现类。 吧需要的文件放入hdf 阅读全文
posted @ 2016-12-14 18:56 加拿大小哥哥 阅读(1352) 评论(0) 推荐(0) 编辑
摘要: 一、背景 1.1 流程 实现排序,分组拍上一篇通过Partitioner实现了。 实现接口,自动产生接口方法,写属性,产生getter和setter,序列化和反序列化属性,写比较方法,重写toString,为了方便复制写够着方法,不过重写够着方法map里需要不停地new,发现LongWritable 阅读全文
posted @ 2016-12-14 12:54 加拿大小哥哥 阅读(841) 评论(0) 推荐(2) 编辑