BZOJ 3555 [CTSC2014] 企鹅QQ Hash
Description
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。Input
第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。Output
仅一行一个正整数,表示共有多少对相似的账户名称。
Sample Input
4 3 64
Fax
fax
max
mac
Sample Output
4
HINT
4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64
这题据说标解不是哈希……不过用哈希就可以水过啊!
先求出每个串的哈希值,然后暴力枚举每一位,判断除去这一位的哈希值是否相同。
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <queue>
using namespace std;
typedef unsigned long long ULL;
const int p = 2333;
char s[30010][550];
ULL hash[50000], py[500], ls[50000];
int main()
{
int len, n, si;
scanf("%d%d%d", &n, &len, &si);
py[0] = 1;
for(int i = 1; i <= 210; i++)
py[i] = py[i - 1] * p;
for(int i = 1; i <= n; i++)
scanf("%s", s[i] + 1);
for(int i = 1; i <= n; i++)
for(int j = 1; j <= len; j++)
hash[i] = hash[i] * p + s[i][j];
int pr = 1, ans = 0;
for(int i = 1; i <= len; i++)
{
for(int j = 1; j <= n; j++)
ls[j] = hash[j] - s[j][i] * py[len - i];
sort(ls + 1, ls + n + 1);
for(int j = 2; j <= n; j++)
{
if(ls[j] == ls[j - 1])
{
ans += pr;
pr ++;
}
else
pr = 1;
}
}
printf("%d", ans);
return 0;
}