BZOJ 3555: [Ctsc2014]企鹅QQ [字符串哈希]【学习笔记】
3555: [Ctsc2014]企鹅QQ
Time Limit: 20 Sec Memory Limit: 256 MBSubmit: 2046 Solved: 749
[Submit][Status][Discuss]
Description
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。
小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
Input
第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。
若 等于2,账户名称中只包含字符‘0’和‘1’共2种字符;
若 等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。
随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。
L只有200,枚举哪一位不同,然后处理哈希值排序就行了
问题:
1.如何处理每次的哈希值:
让哈希值减去枚举的位j,有两种方法,可以只处理前缀哈希值然后-ha[i][j]*po[m-j]+ha[i][j-1]*po[m-j+1],或者处理前缀和后缀哈希值然后j两边的组合起来
PS:如何快速求一个子串的哈希值?
预处理B的所有前缀的哈希值val[i]。
假设采用c进制,再预处理c^0、c^1、……、c^m。
那么,
B[x,y]=val[y]-val[x-1]*c^(y-x+1)因为你要得到的是那一段子串的哈希值,减去的那一块就是B[1,x-1]在B[1,y]中的值
2.如何统计排序后相同个数:
这种简单问题........维护一个cnt为当前连续相同的个数......
注意:字符串不是只64,ascall码到了90多....进制大一点且最好为质数
#include <iostream> #include <cstdio> #include <cstring> #include <algorithm> using namespace std; typedef unsigned long long ll; const int N=3e4+5,M=205,B=107; inline int read(){ char c=getchar();int x=0,f=1; while(c<'0'||c>'9'){if(c=='-')f=-1; c=getchar();} while(c>='0'&&c<='9'){x=x*10+c-'0'; c=getchar();} return x*f; } int n,m,ans; ll ha[N][M],a[N],po[M]; char s[M]; int main(){ //freopen("in.txt","r",stdin); n=read();m=read();int _=read(); po[0]=1; for(int i=1;i<=m;i++) po[i]=B*po[i-1]; for(int i=1;i<=n;i++){ scanf("%s",s+1); for(int j=1;j<=m;j++) ha[i][j]=ha[i][j-1]*B+s[j]; } for(int j=1;j<=m;j++){ for(int i=1;i<=n;i++) a[i]=ha[i][m]-ha[i][j]*po[m-j]+ha[i][j-1]*po[m-j+1]; sort(a+1,a+1+n); int cnt=0; for(int i=2;i<=n;i++){ if(a[i]!=a[i-1]) cnt=0; else cnt++; ans+=cnt; } } printf("%d",ans); }