摘要: 1. top K问题:在海量数据中找出出现频率最高的前K个数、或从海量数据中找出最大的前K个数,这类问题统称为top K问题。 针对top K类问题,通常比较好的方式是分治+hash+小顶堆 eg:在1亿个浮点数中找出其中最大的10000个。 方法一:排序取出前10000个。  每个float占4B 阅读全文
posted @ 2016-03-13 12:22 cjt1991 阅读(416) 评论(0) 推荐(0) 编辑