2020年7月17日

海量数据查找最大的前k个数(小顶堆)

摘要: 在大规模数据处理中,经常会遇到的一类问题:在海量数据中找出出现频率最好的前k个数,或者从海量数据中找出最大的前k个数,这类问题通常被称为top K问题.例如搜索最热门的商品,最活跃的用户. eg:有1亿个浮点数,如果找出期中最大的10000个? 最容易想到的方法是将数据全部排序,然后在排序后的集合中 阅读全文

posted @ 2020-07-17 14:32 家有四只胖加菲 阅读(1259) 评论(0) 推荐(0) 编辑

导航