摘要: 参考:十道面试题与十个海量数据处理方法总结 1.top K问题 分治/hash映射+hashmap统计+堆排序 (PS: 1.如果数据可以一次性放入内存则不需要分治;2.topK小用大根堆,topK大用小根堆;) 分治/hash映射:数据太大,内存受限;把大文件化成(取模映射)M个小文件; hash 阅读全文
posted @ 2017-02-26 17:54 不闻余物 阅读(198) 评论(0) 推荐(0) 编辑