摘要: 问题描述:这是典型的并查集的应用,并查集的概念详见:http://www.doc88.com/p-375363060663.html#coding:utf-8#py2.7class unionfind: def __init__(self, groups): self.group... 阅读全文
posted @ 2013-10-16 18:55 爱知菜 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 问题出自:http://blog.csdn.net/v_july_v/article/details/62794986、在2.5亿个整数中找出不重复的整数,注,内存不足以容纳这2.5亿个整数。 方案1:采用2-Bitmap(每个数分配2bit,00表示不存在,01表示出现一次,10表示多次,11无意... 阅读全文
posted @ 2013-10-16 14:27 爱知菜 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 问题原型:http://blog.csdn.net/v_july_v/article/details/62794982、搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重... 阅读全文
posted @ 2013-10-16 11:52 爱知菜 阅读(2002) 评论(0) 推荐(0) 编辑