1.5 快速找出故障机器

题意:给n个不同的数组成集合A,初始集合B等于集合A,若集合B中有元素丢失,把集合A和B中所有元素装进容器S,如何利用集合A和容器S快速找到丢失元素?

解法一的思路很直接,统计所有数字在容器S中出现次数之和,若出现次数为1(即只在集合A中出现),那么这个数字就是丢失的。优点是无论丢多少数字都能找出来,缺点很明显,空间复杂度太高。

解法二实际上是解法一的改进,我们只需要找出出现一次的元素,所以出现两次的结果没必要保存。相对解法一,空间复杂度在运气好的情况下可以为O(1),运气不好则还是O(N)。

解法三的想法是,将容器S中所有元素相异或,若丢失一个元素,则出来的结果就是丢失的元素,丢两个,则需要利用结果中为1的位将容器S中元素分类两类,再分别异或。这种方法的空间复杂度为O(1),并且位运算本身就是非常高效的。

但是,解法三在丢失数字多的开始变得麻烦起来。现在以丢失3个数字为例,首先还是将容器S中所有元素相异或,得到一个数字,这个数字是丢失的3个数字相异或的结果。随便找一个0位或者1位(因为可能出现只有0位和只有1位的情况),假设找了一个1位,那说明三个数字的在这个位上的组合有两种可能:100或者111。现在利用这个位在容器S中分两类,分别异或,结果有两种可能:两个不为0的数(对应100),或者其中有一个为0,一个和容器S全部求和的一样(对应111)。前一种情况中,得到的两个数中的奇数就是要找的3个数字之一,另外两个数字得利用前面找两个数字的方法来求;而后一种情况只能说不走运了,唯一有用的地方可能就是再次查找的时候可以舍弃结果为0的那个分类,继而重复之前的过程。

这种方法本质上是利用异或后得到的信息,对容器S中元素进行分类,使得类中只包含一个丢失元素,继而找到丢失元素。

解法四是预先给集合A求和,若得到和为p,容器S元素之和为q,则丢失元素之和为2p-q。若丢失一个元素,则结果已经出来了,若是2个或者多个,则还需要更多的信息。2个的话,书中已经给出答案,即预先存储集合A所有元素的平方和或者或者乘积等,这样可以构造出一个二元二次方程组求解。但是,随着缺的元素增多,要构造的等式也越来越多,就不太实用了。

总之,时间和空间难以兼得,但对于题设中这种大数据里面找一两个数据情况,取巧的方法还是有可能的。

难怪我们的语言中以三为众,因为到了三这个数的时候,事情容易变得复杂,古人的智慧啊!

posted on 2012-10-16 12:25  罗辑  阅读(223)  评论(0编辑  收藏  举报