面试题35:第一个只出现一次的字符
题目:在字符串中找出第一个只出现一次的字符。如输入“abaccdeff”,则输出‘b’。
方法1:
看到这个题目,最直观的想法就是就是遍历法,也就是从头开始取字符串中的一个字符,将其与其后的所有字符比较,如果有相同的字符,那么就证明它不是只出现一次的字符。当第一次出现遍历完其后字符并且没有重复时,表明这个字符就是“第一个只出现一次的字符”。如果字符串有n个字符,每个字符可能与后面的O(n)个字符相比较,因此这种思路的时间复杂度是O(n2)。
方法2:
题目中要求第一个只出现一次的字符,那么就跟字符出现的次数有关。我们考虑如何统计字符出现的次数,然后找出第一个次数为1的那个字符。这里我们需要一个数据容器来保存字符出现次数,并且能够通过字符找出其相对应的次数。哈希表就是一种常用用的容器。
我们可以定义哈希表的键值(Key)是字符的ASCII值,而值(Value)是该字符出现的次数。同时我们需要扫描两次字符串,第一次扫描字符串时,每扫描到一个字符就在哈希表的对应项中把次数加1。接下来第二次扫描的时候,没扫描到一个字符就能在哈希表中得到该字符出现的次数。找出第一个Value为1的那个key就是我们需要找到那个字符。
方法1和方法2的代码实现
#include<iostream> #include<stdlib.h> using namespace std; //O(n^n)的时间复杂度 char FirstNotRepeatingChar2(char *pString) { //如果是空指针,返回\0 if(pString==NULL) return '\0'; int len=strlen(pString); for(int i=0;i<len;i++) { int flag=0;//标识位,0表示这个字符只出现一次。 for(int j=i+1;j<len;j++) { if(pString[i]==pString[j]) { flag=1;//1表示在当前字符后面存在于该字符相同的字符。 } } if(flag==0) return pString[i]; } return '\0'; } //O(n)的时间复杂度 char FirstNotRepeatingChar(char *pString) { //如果是空指针,返回\0 if(pString==NULL) return '\0'; //定义hash表长度256,并创建哈希表 const int len=256; int hashtable[len]; for(int i=0;i<len;i++) { hashtable[i]=0; } char *pHashkey=pString; //第一遍遍历字符串,求出每个字符出现的次数 while((*pHashkey)!='\0') { hashtable[*(pHashkey++)]++; } pHashkey=pString; //第二遍遍历字符串,求出第一个只出现一次的字符,每次都是按照字符串的顺序遍历 while((*pHashkey)!='\0') { if(hashtable[*pHashkey]==1) return *pHashkey; pHashkey++; } return '\0'; } void main() { char *pString="abaccdeff"; //cout<<pString<<endl; //cout<<pString[1]<<endl; cout<<sizeof(pString)<<endl;//4 cout<<strlen(pString)<<endl;//9 cout<<FirstNotRepeatingChar(pString)<<endl; cout<<FirstNotRepeatingChar2(pString)<<endl; system("pause"); }
字符(char)是一个长度为8bit的数据类型,因此总共最多能够表示256种字符。所以在前面的代码示例中我们直接创建了一个长度为256的整型数组,每个字符根据其ASCII值作为数组的下标对应数组的一个数字,而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为256,以字符ASCII吗为键值的哈希表。
但是假如我们的字符串长度小于256,那么我们可以通过创建一个字符串长度的整型数组来存放键值,键值是ASCII%len。代码实现如下:
char FirstNotRepeatingChar3(char *pString) { //如果是空指针,返回\0 if(pString==NULL) return '\0'; int len=strlen(pString);//求字符串长度 int *hashtable=new int[len];//定义一个动态数组,其长度为字符串的长度 //初始化动态数组,初始值为0 for(int i=0;i<len;i++) { hashtable[i]=0; } char *pHashkey=pString; //第一遍遍历字符串,求出每个字符出现的次数 while((*pHashkey)!='\0') { hashtable[(*(pHashkey++))%len]++; } pHashkey=pString; //第二遍遍历字符串,求出第一个只出现一次的字符,每次都是按照字符串的顺序遍历 while((*pHashkey)!='\0') { if(hashtable[(*pHashkey)%len]==1) return *pHashkey; pHashkey++; } return '\0'; }
上述思想错误,因为ASCII%len结果相等,但是ASCII可能不相等。比如字符串为“abacdeffk”,那么第一个只出现一次的字符不是b,而是c。这是因为b跟k对len求hash值结果相同。