摘要:
问题描述:在2.5亿个整数中找出不重复的数,注意,内存不足以容纳2.5亿个整数。 分析解读:方法一:分治法采用hash的方法,把这2.5亿个数划分到更小的文件中,从而保证每个文件的大小不超过可用内存的大小。然后对于每个小文件而言,所有的数据可以一次性被加载到内存中,因... 阅读全文
摘要:
题目描述:在2.5亿个整数中判断一个数是否存在,注意,内存不足以容纳2.5亿个整数。 分析解答:方法一:分治法对于大数据相关的算法题,分治法是一个非常好的方法。针对这一题来说,主要思路为:可以根据实际可用内存的情况,确定一个Hash函数,比如:hash(value)%... 阅读全文