百度2014校招笔试题目题解(更新了第1题的算法,10.9下午)
百度2014校招笔试题目题解
----武汉站,9.28号百度校招笔试题目算法题目部分
二、算法与程序设计题
1、给定任意一个正整数,求比这个数大且最小的“不重复数”,“不重复数”的含义是相邻两位不相同,例如1101是重复数,而1201是不重复数。(15分)
2、长度为N(N很大)的字符串,求这个字符串里的最长回文子串。(15分)
3、数轴上从左到右有n各点a[0], a[1], ……,a[n -1],给定一根长度为L的绳子,求绳子最多能覆盖其中的几个点。(15分)
这是百度的笔试题目,好像是什么系统行为分析师职位的笔试题目!博文最后会贴出试题照片!
题解:(题解非官方,仅供参考,转载请联系博主,有错误的地方望指正!谢谢)
1、给定任意一个正整数,求比这个数大且最小的“不重复数”,“不重复数”的含义是相邻两位不相同,例如1101是重复数,而1201是不重复数。
解: 这道题目我也没有什么特别出彩的算法,就是按照常规思路来求解,首先要理解什么叫做“不重复数”,这是解题的关键之一,相邻两位不相同的数即为“不重复数”;还有一个地方要注意的就是“求比这个数大且最小的”,就是在比给定数大的不重复数中找到最小的!理解了这两个地方,这道题目就可以着手求解了!
我用一个实例来说说我的思路,加入给定的正整数为11233:
用最常规的方法,就是每次对这个数加1,判断是不是“不重复数”,加1后为11234,有两个1重复了,于是继续加1,……,那么主要就在判断是不是“不重复数”上面了,我设置了两个变量,是currentBit, lastBit,顾名思义,lastBit保存上一个数位的值,currentBit保存当前数位的值,拿整数12345来说,就是初始化lastBit = 5,然后计算currentBit = 4;下一步,把currentBit 值赋给lastBit,即lastBit = 4,计算currentBit = 3;依次类推。
说到这里,很多朋友觉得可以有更加高效的方法,小难点有4:
1、因为可以直接定位到“重复”的数位那里,比如12344,我们可以直接定位到个位数4和十位数4上面,然后在低位数(这里就是个位数)上加1即可,事实上,不是如此简单,假设是对整数12199呢?还能简单的加1操作吗,加1之后结果为12200,那结果显然是错的,当然这也是可以处理的,处理方法就是把12200继续拿到循环去判断是不是“非重复数”;
2、这里又产生一个问题,因为“重复“的数位可能不止一对,有可能有多对,比如整数11233,定位“33”之后变为“34”,定位“11”之后变为“12”,结果就是12234。又有重复的地方,就是“22”。继续拿到循环去重复;
3、还有要注意的是,你的程序设计,是如何存储数位的值的,是一个一个数位的值求出来呢?还是像我这样设置一个前后索引?每个数位取值,程序会变得繁琐复杂,不易读懂,如果是设置前后索引,则要注意程序退出循环的条件!
4、对于存在多对“重复”数位的正整数,数位“重复”的定位和变换,是从高位到低位,还是从低位到高位呢?正确的应该是从高位到低位,这与我们的程序设计也带来了不便。
这些就是我在试图找到高效算法时得到的经验,每个小难点都要处理,有点繁琐,有耐心的朋友,可以试着写一下更高效的算法,另外,使用了比较高效的算法,代码尽量保持简洁,并告知博主,谢谢!
注:评论网友13楼“巴鲁斯”给出了高效的C#算法代码,这个算法我当初也考虑了,我主学C,只是C处理字符串没有C#、Java那么方便,类型转换也比较麻烦,就没去管,十分感谢“巴鲁斯”朋友的code!来自评论中24楼朋友“garbageMan”给出了比较简洁的c语言代码,采用递归方法,值得借鉴!再次感谢!
my code:(简单加1的方法)
/* 给定任意一个正整数,求比这个数大且最小的“不重复数”,“不重复数的含义是相邻两位不相同,例如1101是不重复数” */ #include <stdio.h> #include <stdlib.h> int getNumNonrepetition(const int NumGived) { int flag = 0;//为0表示该数不是“不重复数” int numRepeat = NumGived; int numTemp = 0;// int currentBit = 0, lastBit = 0;//前后数位索引 while(1) { numRepeat++; //初始化后索引 numTemp = numRepeat; lastBit = numTemp % 10; numTemp /= 10; flag = 1; //判断该数是不是“非重复数” while(numTemp != 0) { currentBit = numTemp % 10; numTemp /= 10; if(lastBit == currentBit) { flag = 0; break; } lastBit = currentBit; } if(flag == 1)//该数为不重复数,返回 { return numRepeat; } } } int main(void) { int NumGived = 19922884; int result = getNumNonrepetition(NumGived); printf("the number is %d\n", result); return 0; }
更新内容:(10.9号下午)
简单加1的算法,效率太低,看到这么多的朋友的评论,大家的算法大同小异,我也写了一个算法,拿出来和大伙分享。
算法:
1、把整数放到字符数组里面去,从高位为低位(用变量i)扫描,找到重复的数位,重复数位为“99”跳到第2步,否则跳到第3步,若没有重复的数位,则该数为不重复数,返回;
2、遇到“99”的重复数,则把“99”改为“00”,然后在“99”前面一位字符加1,把扫描的地方定位在“99”往高位方向的第2位,比如是1299,变换后为1300,然后把扫描变量 i 定位在1这一数位上,返回第1步;
3、遇到非“99”的重复数,则直接在低位加1,后面依次变为010101……,结果就是最小的不重复数,返回改值;
至于前面说的一些难点,真是害怕误导了大家,毕竟总有考虑不到的地方,希望见谅!
code:(高效)
#include <stdio.h> #include <stdlib.h> #include <string.h> #define SIZE 100 int getNumNonrepetition(const long long NumGived, char NumStr[]) { int NumTmp = NumGived; int NumLength = 0; int i = SIZE - 1; //把整数放到字符数组里面去,从后往前放,比如1234, //那么数组NumStr[96] = 1 NumStr[97] = 2 NumStr[98] = 3 NumStr[99] = 4, SIZE = 100 do { NumStr[i] = NumTmp % 10 + '0'; NumTmp /= 10; i--; }while(NumTmp != 0); NumLength = SIZE - i - 1;//计算整数的位数 int flag = 0;//设置010101的时候用的变量 i = SIZE - NumLength; while( 1 ) { //定位到重复的位上面,下标i + 1为低位,此时NumStr[i] == NumStr[i + 1] while(i + 1 < SIZE && NumStr[i] != NumStr[i + 1]) i++; if(i == SIZE - 1) break;//扫完一遍,没有重复的,跳出循环,该数是不重复数 if(NumStr[i + 1] == '9')//重复的数位为99这种情况,将这两位全部置0,高位加1 { NumStr[i + 1] = '0'; i--; NumStr[i + 1] = '0'; i--; NumStr[i + 1] += 1; } else//重复的 { //低位加1 NumStr[i + 1] += 1; i += 2; flag = 0; //后续全部设为0101……,这个时候肯定是不重复数了,所以可以跳出循环 while( i < SIZE ) { NumStr[i] = flag % 2+ '0'; flag++; i++; } break; } } //打印最小的”不重复数“ int start = SIZE - NumLength; //如果是99开头的数字,高位可能会进位,判断是否为零,不为零则有进位,需打印出来 if(NumStr[start - 1] != '0') putchar(NumStr[start - 1]); for(i = start; i < SIZE; i++ ) { putchar(NumStr[i]); } return 0; } int main(void) { long long NumGived = 119998988; char NumStr[SIZE]; memset(NumStr, '0', SIZE * sizeof(char)); getNumNonrepetition(NumGived, NumStr); return 0; }
2、长度为N(N很大)的字符串,求这个字符串里的最长回文子串。
解:题目指出“N很大”,就是提示我们不要想通过遍历的方法来找到这个字符串,我想到的就一种解法,时间复杂度应该不高,但是我算不出来这个算法的复杂度是多少,首先说一下什么是回文字符串:回文字符串是指从左到右和从右到左相同的字符串,比如"1221"或者“12321”都是回文字符串。刚好举得这两个回文字符串的例子就是我的算法的两个类别:
第一类“12321”:中间是一个单独的字符。算法的思想是从第2个字符直到倒数第2个字符遍历,每遇到一个字符,就依次判断这个字符前后的字符是否相等,如果相等,则继续判断下一个字符,直到以这个字符为中心的两边对称的字符不相等为止,或者前后字符的位置数组越界为止;计算此时的回文字符串的长度,与之前的比较,记下较长的回文字符串的长度和中心字符的位置;遍历结束则返回最大长度和中心字符的位置。
图示:若字符串为“1234321”
第二类“123321”:中间是两个相同的字符。算法思想同上,其实是一样的过程!图解也是一样的!
my code:
/* 长度为N(N很大)的字符串,求这个字符串里的最长回文子串。 */ #include <stdio.h> #include <stdlib.h> #include <string.h> //第一类“12321”:中间是一个单独的字符 int FindLongPaliSubstr_Odd(const char A[], int * indexMid) { int i = 0, cnt = 0;//cnt表示前后移动位数 int MyMax = 0; int lenOfA = strlen(A); *indexMid = 0; for(i = 1; i <= lenOfA - 2; i++) { cnt = 0; while(i - cnt >= 0 && i + cnt <= lenOfA - 1 && A[i - cnt] == A[i + cnt]) { cnt++; } cnt--; //找到较大长度的回文字符串,保存中心字符的位置 if(MyMax < 2 * cnt + 1) { MyMax = 2 * cnt + 1; *indexMid = i; } } return MyMax; } //第二类“12321”:中间是两个相同的字符。 int FindLongPaliSubstr_Even(const char A[],int * First) { int i = 0, cnt = 0;//cnt表示前后移动位数 int MyMax = 0; int lenOfA = strlen(A); *First = 0;//中间两个相同字符的第一个字符位置 for(i = 0; i <= lenOfA - 2; i++) { if(A[i] == A[i + 1]) { cnt = 1; while(i - cnt >= 0 && (i + 1 + cnt) <= lenOfA - 1 && A[i - cnt] == A[i + 1 + cnt]) { cnt++; } cnt--; //找到较大长度的回文字符串,保存中心第一个字符的位置 if(MyMax < 2 * cnt + 2) { MyMax = 2 * cnt + 2; *First = i; } } } return MyMax; } int main(void) { char A[] = "adfadfbadfdg12321fagage"; int indexMid = 0; int First = 0; int i = 0; //两种类别的最长回文子串的长度 int MaxOdd = FindLongPaliSubstr_Odd(A, &indexMid); int MaxEven = FindLongPaliSubstr_Even(A, &First); printf("indexMid = %d\n", indexMid); printf("First = %d\n", First); //哪类比较大,输出哪一类的回文子串 if( MaxOdd > MaxEven) { for(i = indexMid - (MaxOdd - 1) / 2; i <= indexMid + (MaxOdd - 1) / 2; i++) { putchar(A[i]); } } else { for(i = First - (MaxEven - 2) / 2; i <= First + 1 + (MaxEven - 2) / 2; i++) { putchar(A[i]); } } return 0; }
3、数轴上从左到右有n各点a[0], a[1], ……,a[n -1],给定一根长度为L的绳子,求绳子最多能覆盖其中的几个点。
解:我对第3题的题解也是很常规,就是把相邻两个点的距离求出来,保存在一个数组arr[N]里面,从头到尾遍历数组arr[N],和直接选择排序差不多,写两个for循环,第一个for循环(外循环)中计数器 i 表示连续线段的起点,第二个for循环(内循环)的计数器 j 从 (i + 1)开始,依次累加Sum,若Sum > L,则记录点的个数(j - i)中的较大值max;其中,外循环,只要遇到的数比L大,就continue,内循环,只要遇到的数比L大,就break,这是因为长度为L的绳子是不可能覆盖这些点的,可以直接跳过!
如图:
my code:
/* 数轴上从左到右有n个点a[0],a[1],...,a[n - 1],给定一根长度为L的绳子,求绳子最多能覆盖其中几个点。 */ #include <stdio.h> #include <stdlib.h> #include <string.h> #define N 8 int MaxTimesOfL(int A[], int L) { int i = 0, j = 0; int *arr = (int *)malloc(sizeof(int) * (N - 1)); memset(arr, 0, sizeof(int) * (N - 1)); //初始化数组arr,两点间的距离为一个数组元素 for(i = 0; i < N - 1; i++) { arr[i] = A[i + 1] - A[i]; } //输出该数组 for(i = 0; i < N - 1; i++) { printf("%-3d", arr[i]); } int MaxTimes = 0; int Sum = 0; //遍历找到覆盖的最多点数 for(i = 0; i < N; i++) { if(arr[i] > L)//遇到比L大的数则跳过 { continue; } Sum = arr[i]; for(j = i + 1; j < N - 1; j++) { if(arr[j] > L)//遇到比L大的数则跳过,这一句对于程序来说加与不加都一样 { break; } Sum += arr[j]; if(Sum > L) { break; } } MaxTimes = (MaxTimes > (j - i)) ? MaxTimes : (j - i); } return (MaxTimes + 1);//因为是线段,所以要加1表示覆盖的点数 } int main(void) { int A[] = {-1, 0, 3, 9, 11, 13, 14, 25}; int L = 5; int result = MaxTimesOfL(A, L); printf("\nthe max times is %d\n", result); return 0; }
更新内容:(10月4日下午)
有网友指出,我的算法其实没必要申请多余的数组,那么有没有更加高效的算法呢,我身边的一个大神给了我一个O(N)复杂度的算法:
他的原话:两个指针,一个front,一个rear,每次front-rear,比L小,看覆盖的点数。保存覆盖点数的最大值,然后front++;比L大,rear++,每个数最多遍历2遍,复杂度O(N)。
对于这个算法,他给了一个形象的比喻:
就好像一条长度为L的蛇。头伸不过去的话,就把尾巴缩过来最多只需要走一次,就知道能覆盖几个点
实现代码:
#include <stdio.h> #include <stdlib.h> int main(void) { int front = 0 , rear = 0;//设置首尾指针索引 int cnt = 8; int L = 15;//绳子长度 int MaxTimes = 0; int arr[] = {-1, 0, 3, 9, 11, 13, 14, 25};//数轴上的点 while(front < cnt) { //比L小,则计算MaxTimes,作front++; if(arr[front] - arr[rear] <= L) { MaxTimes = MaxTimes > (front - rear) ? MaxTimes : (front - rear); front++; } else//比L大,rear++; { rear++; } } printf("the max times is %d\n", MaxTimes + 1);//第一个数是没有参与计数的,所以要在最后加1 return 0; }
最后贴一下试题: