字符串哈希

题目链接

P3370 【模板】字符串哈希


题目描述

如题,给定 \(N\) 个字符串(第 \(i\) 个字符串长度为 \(M_i\),字符串内包含数字、大小写字母,大小写敏感),请求出 \(N\) 个字符串中共有多少个不同的字符串。

友情提醒:如果真的想好好练习哈希的话,请自觉,否则请右转PJ试炼场:)

输入格式

第一行包含一个整数 \(N\),为字符串的个数。

接下来 \(N\) 行每行包含一个字符串,为所提供的字符串。

输出格式

输出包含一行,包含一个整数,为不同的字符串个数。

输入

5
abc
aaaa
abc
abcc
12345

输出

4

说明/提示

对于 \(30\%\) 的数据:\(N\leq 10,M_i≈6,\)\(Mmax\leq 15\)

对于 \(70\%\) 的数据:\(N\leq 1000,M_i≈100,Mmax\leq 150\)

对于 \(100\%\) 的数据:\(N\leq 10000,M_i≈1000,Mmax\leq 1500\)

样例说明:

样例中第一个字符串(abc)和第三个字符串(abc)是一样的,所以所提供字符串的集合为{aaaa,abc,abcc,12345},故共计4个不同的字符串。

代码

设字符串平均长度为 \(s\),则

  • 时间复杂度:\(O(ns+nlogn)\)
#include<bits/stdc++.h>
using namespace std;
int a[10010],n;
int Hash(string s)
{
    unsigned long long res=0;
    for(int i=0;i<s.size();i++)
        res=res*131+s[i]-'0'+1;
    return res;
}
int main()
{
    scanf("%d",&n);
    string s;
    for(int i=1;i<=n;i++)
    {
        cin>>s;
        a[i]=Hash(s);
    }
    sort(a+1,a+1+n);
    int res=1;
    for(int i=2;i<=n;i++)
        if(a[i]!=a[i-1])res++;
    printf("%d",res);
    return 0;
}

posted @ 2021-09-20 22:56  zyy2001  阅读(64)  评论(0编辑  收藏  举报