转载:解答Google的一道面试题


首先对博主的独立思考和专研精神表示膜拜!

转载地址:http://blog.csdn.net/jiaomeng/article/details/1435226 

在找大规模数据处理的相关资料时,逛到该博主博客,发现了很多独立思考的文章

以下为转载全文,红色字体处为我的标注和添加的理解。


----------------------------------------------------------------------------------------------------------------------------------------------------------------------------


这几天有一道Google的面试题在论坛炒得很火,题目如下:“有一个100层高的大厦,你手中有两个相同的玻璃围棋子。从这个大厦的某一层扔下围棋子就会碎,用你手中的这两个玻璃围棋子,找出一个最优的策略,来得知那个临界层面。”下面给出我的分析和解答。

 

为了得到两个棋子的最优策略,我们先简化问题,看看一个棋子的情况。如果手中只有一个棋子,为了得知临界层面,你只有一种选择:从2楼开始,一层一层地试,直到棋子被打碎,此时你站的楼层就是所求的临界层面。在最差的情况下,我们需要投掷99-2+1=98次,你可能奇怪为什么不是100-2+1=99次,那是因为题目已经告诉我们“从这个大厦的某一层扔下围棋子就会碎”,所以在99层扔下来还没碎的话就不用去100层了——从那里扔它一定会碎。(假设只有1个棋子该怎么办,思考切入点很好

 

从一个棋子的策略我们可以看出,一个棋子就足以解答这个问题了。现在又多了一个棋子,该如何利用它呢很自然地,我们希望能通过这个棋子缩小这种一层一层查找的范围。为了缩小范围,我们将整个大厦的层数分成x段,在这x段中查找那个临界段,然后在临界段中再一层一层地找临界层。比如可以将大楼分成4段,我们分别在25层、50层、75层投掷棋子,以确定临界段;如果临界段在25层到50层,我们再从26层开始一层一层查找临界层。

 

分析到这里,问题就转化成了如何确定分段数x使棋子投掷的次数最少的问题。在最差的情况下,要确定临界段,我们需要投掷100/x-1次;确定了临界段之后要确定临界层,我们需要再投掷x-1这个地方作者可能不小心,写反了,确定临界段x-1,确定临界层100/x-1)。因此,问题就成了求函数f(x)=(100/x-1)+(x-1)的最小值问题。先对f(x)求导,f’(x)=1-100/x2,令f’(x)=0求出驻点x=10(x=-10舍去)。由于f(x)存在最小值且只有一个驻点,所以当x=10f(x)取得最小值,最小值为18。这样就解答了这个问题。(不等式就可以求了)

 

其实10这个结果也很容易直接看出来。在只有一个棋子时,我们相当于把整个大厦分成了一段,这一段有100层。在有两个棋子时,我们有很多分法,但无论怎么分,如果分成k1段,每段有k2层,那么就有k1k2=100。在最坏的情况下,我们需要投掷(k1-1)+(k2-1)次。因此问题也可以表述成在k1k2=100的条件约束下,如何让函数f(k1,k2)= k1+k2最小。(巧妙)在初等数学中,我们知道在矩形面积一定的情况下,正方形的周长最小。利用这个结论,我们可以直接得出结论k1=k2=10

 

现在问题已经完满解决,但我还想把这个问题扩展一下,把它变成“m层楼n个棋子”的情况。首先来看这样一个问题,给定m层楼,多少个棋子就“足够”了,也就是说,再多的棋子也不能加快查找的过程。在我所能想到的方法里,二分法应该是最优的,如果按二分法来查找,则需要ceiling(log2m)个棋子(ceiling是向上取整函数),超过这个数再多的棋子也无益。

 

如果n>=ceiling(log2m),那就采用二分法,现在考虑n< ceiling(log2m)的情况。前面已经看到,当n=2时,问题可以表述成在k1k2=100的条件约束下,求函数f(k1,k2)= k1+k2的最小值。类似地,在n个棋子的情况下,问题可以表述成在k1k2…kn=m的条件约束下,求函数f(k1,k2,…,kn)=k1+k2+…+kn的最小值。利用拉格朗日乘数法,我们可以很容易地求出:当k1=k2=…=kn=nm时,这个多元函数取得最值。nm有可能不是整数,因此这只是一个理论上的结果。

 

我们换一个思路考虑,m层楼n个棋子的问题其实就是如何将m分解成n个因子相乘,从而让各个因子之和最小。如何分解m使得策略最优就成了问题的关键。前面得出的结论提示我们尽量让各个因子相等或者相差较小,它们相加的结果才会较小。比如,100层楼3个棋子的情况,554应该是一个最优的选择。

 

考虑到这里,又有一个问题出现了:是不是m分解的越多越好呢?比如,将100分解成1010好呢,还是2510好?这个问题其实就是在问,两个大于1的整数,它们的和大呢还是积大。很明显,当然是积大,因此将m分解的越多越好。

 

数论告诉我们,质数是整数的基础,所有整数都可以分解成若干个质数的乘积。因此,如果将上面的方法发挥到极致,那就要求我们把m分解成质数的乘积。当然,如果棋子足够多,这并不是最优的方法,对质数层楼的段,你仍然可以采用二分法。


------------------------------------------------------------------------------------------------------

上文贴出之后,我又在CSDN和ChinaUnix的论坛看了一些网友的解法,发现上述方法并非最优。将大楼分段以缩小查找范围的想法是没错的,问题在于是否应该均匀分段。

题 目要求我们总的投掷次数要最少。在分段之后,总的投掷次数就等于确定临近段的次数加上确定临界层的次数。如果我们均匀分段,则确定临界层的最坏投掷数是固 定的(9次),随着我们确定临近段的投掷次数增加,总的投掷次数也在增加。这样一来,随着临界段的不同,投掷次数也不同。

这也就是为什么上述方法不是最优的原因:投掷次数分布不均。按最坏情况估计,这种方法就多做了几次。为了使最坏情况的投掷数最小,我们希望无论临界段在哪里,总的投掷数都不变,也就是说将投掷数均匀分布。

接下来的解决方案就很容易想出了既然第一步(确定临界段)的投掷数增加不可避免,我们就让第二步(确定临界层)的投掷数随着第一步的次数增加而减少。第一步的投掷数是一次一次增加的,那就让第二步
的投掷数一次一次减少。假设第一次投掷的层数是f,转化成数学模型,就是要求f+(f-1)+...+2+1>=99,即f(f+1)/2>=99,解出结果等于14。

这种方法要推广到n(n>2)个棋子的情况比较困难。我初步的想法是,先用均匀分段求出一个解,然后修正这个解使投掷次数均匀分布。如果你对此有兴趣,不妨思考一下具体的解法。





posted @ 2011-08-13 00:59  jinmengzhe  阅读(959)  评论(0编辑  收藏  举报