面试题35：第一个只出现一次的字符

题目：在字符串中找出第一个只出现一次的字符。如输入“abaccdeff”，则输出‘b’。

方法1：

看到这个题目，最直观的想法就是就是遍历法，也就是从头开始取字符串中的一个字符，将其与其后的所有字符比较，如果有相同的字符，那么就证明它不是只出现一次的字符。当第一次出现遍历完其后字符并且没有重复时，表明这个字符就是“第一个只出现一次的字符”。如果字符串有n个字符，每个字符可能与后面的O(n)个字符相比较，因此这种思路的时间复杂度是O(n²)。

方法2：

题目中要求第一个只出现一次的字符，那么就跟字符出现的次数有关。我们考虑如何统计字符出现的次数，然后找出第一个次数为1的那个字符。这里我们需要一个数据容器来保存字符出现次数，并且能够通过字符找出其相对应的次数。哈希表就是一种常用用的容器。

我们可以定义哈希表的键值(Key)是字符的ASCII值，而值(Value)是该字符出现的次数。同时我们需要扫描两次字符串，第一次扫描字符串时，每扫描到一个字符就在哈希表的对应项中把次数加1。接下来第二次扫描的时候，没扫描到一个字符就能在哈希表中得到该字符出现的次数。找出第一个Value为1的那个key就是我们需要找到那个字符。

方法1和方法2的代码实现

View Code

#include<iostream>
#include<stdlib.h>
using namespace std;

//O(n^n)的时间复杂度
char FirstNotRepeatingChar2(char *pString)
{
    //如果是空指针，返回\0
    if(pString==NULL)
        return '\0';

    int len=strlen(pString);
    for(int i=0;i<len;i++)
    {
        int flag=0;//标识位，0表示这个字符只出现一次。
        for(int j=i+1;j<len;j++)
        {
            if(pString[i]==pString[j])
            {
                flag=1;//1表示在当前字符后面存在于该字符相同的字符。
            }
        }

        if(flag==0)
            return pString[i];
    }
    return '\0';
}

//O(n)的时间复杂度
char FirstNotRepeatingChar(char *pString)
{
    //如果是空指针，返回\0
    if(pString==NULL)
        return '\0';
    //定义hash表长度256，并创建哈希表
    const int len=256;
    int hashtable[len];

    for(int i=0;i<len;i++)
    {
        hashtable[i]=0;
    }

    char *pHashkey=pString;
    //第一遍遍历字符串，求出每个字符出现的次数
    while((*pHashkey)!='\0')
    {
        hashtable[*(pHashkey++)]++;
    }

    pHashkey=pString;
    //第二遍遍历字符串，求出第一个只出现一次的字符，每次都是按照字符串的顺序遍历
    while((*pHashkey)!='\0')
    {
        if(hashtable[*pHashkey]==1)
            return *pHashkey;
        pHashkey++;
    }
    return '\0';
}

void main()
{
    char *pString="abaccdeff";
    //cout<<pString<<endl;
    //cout<<pString[1]<<endl;
    cout<<sizeof(pString)<<endl;//4
    cout<<strlen(pString)<<endl;//9
    cout<<FirstNotRepeatingChar(pString)<<endl;
    cout<<FirstNotRepeatingChar2(pString)<<endl;
    system("pause");
}

字符（char）是一个长度为8bit的数据类型，因此总共最多能够表示256种字符。所以在前面的代码示例中我们直接创建了一个长度为256的整型数组，每个字符根据其ASCII值作为数组的下标对应数组的一个数字，而数组中存储的是每个字符出现的次数。这样我们就创建了一个大小为256，以字符ASCII吗为键值的哈希表。

但是假如我们的字符串长度小于256，那么我们可以通过创建一个字符串长度的整型数组来存放键值，键值是ASCII%len。代码实现如下：

View Code

char FirstNotRepeatingChar3(char *pString)
{
    //如果是空指针，返回\0
    if(pString==NULL)
        return '\0';

    int len=strlen(pString);//求字符串长度
    int *hashtable=new int[len];//定义一个动态数组，其长度为字符串的长度
    //初始化动态数组，初始值为0
    for(int i=0;i<len;i++)
    {
        hashtable[i]=0;
    }
    char *pHashkey=pString;
    //第一遍遍历字符串，求出每个字符出现的次数
    while((*pHashkey)!='\0')
    {
        hashtable[(*(pHashkey++))%len]++;
    }

    pHashkey=pString;
    //第二遍遍历字符串，求出第一个只出现一次的字符，每次都是按照字符串的顺序遍历
    while((*pHashkey)!='\0')
    {
        if(hashtable[(*pHashkey)%len]==1)
            return *pHashkey;
        pHashkey++;
    }
    return '\0';
}

上述思想错误，因为ASCII%len结果相等，但是ASCII可能不相等。比如字符串为“abacdeffk”，那么第一个只出现一次的字符不是b，而是c。这是因为b跟k对len求hash值结果相同。

posted @ 2012-09-26 12:03 xwdreamer 阅读(12296) 评论(3) 编辑收藏举报

刷新页面返回顶部

面试题35：第一个只出现一次的字符

方法1：

方法2：

方法1和方法2的代码实现

公告