面试算法小结-转
【一】 时间受限
大部分的面试题,都是对时间复杂度有所要求的,如果有涉及,“最快”一类的字样,毫无疑问,先上时空原理,用空间来换时间。Hash,大数组,一些辅助性的空间,都是首选。在我的面试经历中,有无数次用到过Hash和大数组的。不过,通常这不会是面试官想听的唯一解法,他们紧接着十有八九是会说“如果只有xxxx空间呢?”。说此类方法只是为自己争取更多的时间,并且体现思考的完整性,简而言之,装B用。。。 eg1.1:求一个char(8bit)中,二进制1的个数,越快越好。 -- 《编程之美》 eg1.2:有一个整数数组A[N],让你不用除法,求另一个数组B[N],其中B[i] = A[0]*A[1] ... * A[N-1] / A[i],期望复杂度是O(N)。 -- TopLanguage
【二】 空间受限
这里的空间受限,指的是在大数据分析的逻辑下,空间受限的问题。大部分情况下,就是压缩。位图是一个很好的方法,用一个bit(或几个)取代更大的int类型,最常见的位图是1bit 取代 1int,其实,很多时候,1bit可以取代更大的空间,这完全取决于你需要保留的信息。。。 eg2.1:有一个很大的文件,存放一堆7位的电话号码,号码无重复,请用最小的内存消耗,将其排序。 -- 《编程珠玑》 eg2.2:给10MB的内存,给一个4百万整数的文件,找一个不在文件中的整数。 -- (传说中的Google面试题)
【三】 基于文件
越来越多的大公司,开始关系对文件的处理,上面所说的空间受限的问题,其实也基本都是和文件打交道。基于文件的处理,基本都是寻找,或者排序,最最核心的,就是减少文件读取的次数。除了位图法,还可以考虑哨兵,典型的案例就是外排中,增加单个文件大小的方法。 eg3.1:给定一个包含4300000000个32位整数的顺序文件,找到一个至少出现两次的整数。 -- (传说中的微软面试题,我曾经遇到过类似的)
http://hi.baidu.com/diwayou/blog/category/%B1%E0%B3%CC%D6%E9%E7%E1
eg3.2:有一个文件,有很多很多的整数(也许有100亿),寻找其中最大的K个。 -- 《编程之美》
【四】 常见方法
你需要相信,面试官也是人,他不会有心情花30分钟给你描述一个问题,或者让你做50页纸的推导,考算法的目的只是为了你的思维能力,而不是真的想让你搞定一个复杂的问题。大部分问题,都是有比较快速清晰的解决方法的。。。
1. 分治法 这绝对是你必须考虑使用的一种方法,如果有可能的话。动态规划这东西,在面试的时候比较沉重,不好描述,不好书写,而分治却刚刚好,美丽,快捷,易书写,是面试官杀人越货的首选武器。分治的用法实在是太多了,几乎是无所不在,二分,快排,种群计数,各个唯美无比。。。
eg4.1:给你一个长度为N的整数数组,请找出最大的子数组和。 -- 《编程之美》
eg4.2:求一个int(32bit)中,二进制1的个数。 -- 《代码之美》(注,不是编程之美是另一本书,有一章叫做种群计数,这是一种很酷的分治)
2. 排序和查找 排序出现的次数实在是太多了,很重要的一点,排序的东西才能用二分。二分是如此好用,以至于我们总是想着排序。查找和排序总是紧密联系的,当然,仅仅是为了查找,做一次排序,你需要衡量一下代价。。。
eg4.3:有一个论坛,有ID发帖数目超过总数的一半,给你论坛所有帖子的ID列表,请你找到这个水王。 - -《编程之美》
eg4.4:给一组一维的空间 [1, 6] [2, 4] ... ,请求是否有区间重叠。 -- 《编程之美》
3. 减小问题规模 很多时候,题目看上去很吓人,仔细分析一下,就可以刨去其中大部分的无关内容,获得真正的出题意图,这一点很重要。另外有些时候,题目会在空间上做出一些限制,这个时候,你可以考虑动态的对数据规模进行缩减,比如用减法或除法抵消,用抑或抵消,等等。。。
eg4.5:给一个整数N,求它的阶乘N!,有几个0结尾。 -- 《编程之美》
eg4.6:盒子里有三种颜色的球,红黄蓝,可以用任意两个不同颜色的球,换两个另外颜色的球,比如1红 + 1黄 = 2蓝。现在盒子里面有171个红球,172个黄球,173个蓝球,问,能不能经过若干次交换,最终变成同一颜色的球。 -- TopLanguage
eg4.7:同eg4.3
eg4.8:有一组数,除了一个数只有1个,其他都是两两成对的,请找出那一个不成对的数。另,如果不成对的数有两个,该如何是好。 -- TopLanguage
4. 常量法 典型的速餐方法,它的思想是,一组数,在某些情况下,和一定,通过这个常量,进行反推,可快速搞定一些问题。。。
eg4.9:有一副扑克牌(你可以用任意方式来表示),被抽去一张,请快速找出这抽去的一张是什么? -- 微软面试题,活生生
5. 编码 编码真是个好东西,它可以将复杂的问题抽象化。比如,对一个序列进行编码,可以直接映射到数组脚标上,大大提高访问速度。。。
eg4.10:最近一次百度笔试题
eg4.11:有1000瓶超级名贵的葡萄酒,其中有1瓶有毒。这种毒药很厉害,哪怕被稀释了1000000倍还是可以毒死人的。但这个毒药一定时间后才会毒发,时长是1个月。为了不浪费这些葡萄酒,有1000个壮士决定花5周的时间将毒酒找出,他们只希望最多有10个人牺牲,你需要如何安排才能实现。 -- TopLanguage
6. 概率 不要轻视概率题,哪怕是最基本的概率常识。概率题之所以被青睐,因为它们往往违背直觉,容易让人陷入迷茫,这种场面是面试官喜闻乐见的。我曾经在baidu面试中,被一道简单的概率题,调戏的脸面全无,至今想起,仍然是汗流满面。所以,为了人身安全,复习一下概率的基本知识吧。。。
eg4.12:有一个长度为N的链表,N未知。希望你只遍历一次链表,就从链表中等概率的挑出K个数。 -- TopLanguage
【五】 加速方法
很多时候,你给的算法基本正确,但是还不够优秀。面试官会希望你优化一下。优化的方法有很多,就基本的思路就是,考虑一下到底哪里出现了浪费。常见的浪费有两种,一种是用了比较沉重的运算,比如除法、取模等,你可能需要为计算来加速。另外有时候,你的算法还太粗线条,比如只需要符号,你却计算了总数等等。。。
eg5.1:求两个数的最大公约数。 -- 《编程之美》
eg5.2:有一个整数数组A[N],求其中连续N-1个数的最大乘积。 -- 《编程之美》
eg5.3:估计一下快速排序的比较次数。 -- 《代码之美》
【六】 数据结构
大部分面试时候,我们都是面向数组来设计算法,因为简单变化多,面试官好把握。但其他数据结果,同样也很重要。AVL,B树那样的可能比较复杂,但是链表、树这样的结构,也经常出没,我个人就碰见多次。。。
1. 链表
eg6.1:给你一个单链表的头指针,在不使用大量附加数据或修改原有数据的前提下,检查一个单链表是否有环。 -- 微软面试题,活生生
eg6.2:给你两个链表,如何判断其是否相交,如果相交,如何找到两个链表的第一个交点。 -- 《编程之美》
eg6.3:只给你一个指向链表中某元素的指针,请删除该元素。 -- 《编程之美》
2. 树
eg6.4:写堆排序的算法
eg6.5:判断一棵二叉树T中,是否包含另一颗二叉树P的结构。 -- 微软面试题,活生生
以上一些内容,只是管中窥豹而已,一不小心,还被我写成了题集。原先只是给我自己做个索引的,所以没有加任何求解的内容,如果有兴趣,可以查看相关出处。题目来源主要是一些快餐式的书和论坛,包括《编程之美》《代码之美》《编程珠玑》,其中特别推荐,TopLanguage Group的“今天我们思考”专辑。快餐吃多了总会不营养的,需要慢条斯理的按食谱吃点营养大餐才能真正的强身健体,比如高大爷的圣经,《算法导论》,还有,波利亚的《怎样解题》
==============================
归根结底,面试的算法其实不只是算法而已,面试官看重的是从做题过程中体现出的思考问题的能力,而不是最终的结果本身。你和面试官之间是一场配合和博弈,你需要勾引面试官给你反馈,并抓住它们辅助思考,从而让他们满意。算法在面试中的地位,好比是托福在出国中的地位一样,必须但不是最重要的,它只是考量的各个方面的一部分,不一定就决定生死。所以,有就让它更好点,没有就稍微补充点,足矣。我做过的面试其实不多,有的还不错,有的就像坨屎,只希望,从今往后,努力让我的面试远离粪坑。。。