BZOJ-3555:企鹅QQ(字符串哈希)
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。
仅一行一个正整数,表示共有多少对相似的账户名称。
Sample InputFax
fax
max
mac
Sample Output
4
Hint
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64
思路:对每个串都求一下哈希值,因为只有一位不同,所以可以枚举一下,将每个字符串删除同样位置的字符,然后排序比一下,要是有哈希值(已删去一个字符的)相等的,就算一对。详见代码注释:
1 #include<cstdio> 2 #include<iostream> 3 #include<string> 4 #include<algorithm> 5 6 using namespace std; 7 typedef long long ll;//以下有爆掉的情况会自然溢出,超过ll自动对2^63取模 8 #define maxn 30005 9 10 const ll key=457;//选一个大素数做种子 11 int n,m,s; 12 char str[maxn][205]; 13 ll p[maxn]={1},a[maxn],sum[maxn][205]; 14 ll ans; 15 16 void hash(int x,char *s)//为每个字符串都赋一个映射的哈希函数值,就像它的代号 17 { 18 for(int i=1;i<=m;i++) sum[x][i]=sum[x][i-1]*key+s[i]; 19 } 20 void cal(int j) 21 { 22 for(int i=1;i<=n;i++)//对每个串都删去当前的。因为上一轮哈希值已经减去前一个字符的哈希值了,这一轮要加回来 23 a[i]=sum[i][m]-sum[i][j]*p[m-j]+sum[i][j-1]*p[m-j+1];//这里p的应用,自己举个小例子画一画,把字符当成数字就好 24 sort(a+1,a+1+n); 25 ll now=1; 26 for(int i=2;i<=n;i++)//因为排过序了,所以直接比较前一个和后一个的值,相等就加一组。因为是总对数,对now的当前值直接往答案上加 27 if(a[i]==a[i-1]) ans+=now,now++; 28 else now=1; 29 } 30 int main() 31 { 32 scanf("%d%d%d",&n,&m,&s); 33 for(int i=1;i<=maxn;i++)//提前初始化一下p数组,p的使用方法配合之后的过程来体会 34 p[i]=p[i-1]*key; 35 for(int i=1;i<=n;i++)//hash计算一下 36 scanf("%s",str[i]+1),hash(i,str[i]); 37 for(int i=1;i<=m;i++)//枚举,删去下标为i的那个字符 38 cal(i); 39 printf("%lld",ans); 40 return 0; 41 }
10个月后重做:
唔,这是入驻博客园的第一篇题解,记得那时还懵懵逼逼看了半天黄学长代码才懂,且感到精妙……现在看来好像哈希莽一下就能过了,另外黄学长写那个题解的时候看来也还年轻啊……也是因为近一年里看过很多次这种类似进制的操作了吧。另外原来爆一爆longlong也能过啊,大概负数也算不冲突?当时好像以为longlong是自然溢出。
unordered_map是C++11的BZOJ不支持于是CE……map试了试被卡常于是TLE……只好sort一下,用了4秒多过去。
1 #include <cstdio> 2 #include <algorithm> 3 using namespace std; 4 5 typedef unsigned long long ull; 6 const int maxn = 3e5 + 5; 7 const int seed = 257; 8 9 int N, L, S, ans; 10 char str[maxn][205]; 11 ull p[205], val[maxn], tmp[maxn]; 12 13 int main() { 14 scanf("%d %d %d", &N, &L, &S); 15 p[0] = 1; 16 for (int i = 1; i <= L; i++) 17 p[i] = p[i - 1] * seed; 18 19 for (int i = 1; i <= N; i++) { 20 scanf("%s", str[i] + 1); 21 for (int j = 1; j <= L; j++) { 22 val[i] += p[j] * (int)str[i][j]; 23 } 24 } 25 26 for (int j = 1; j <= L; j++) { 27 for (int i = 1; i <= N; i++) { 28 tmp[i] = val[i] - p[j] * (int)str[i][j]; 29 } 30 sort(tmp + 1, tmp + 1 + N); 31 for (int i = 1, pos = 1; i <= N; i = pos) { 32 while (pos <= N && tmp[pos] == tmp[i]) pos++; 33 ans += (pos - i) * (pos - i - 1) / 2; 34 } 35 } 36 37 printf("%d\n", ans); 38 return 0; 39 }