Description
PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。 小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。 小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。 为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
Input
第一行包含三个正整数N, L,S 。其中N表示账户名称数量, L表示账户名称长度, S用来表示字符集规模大小,它的值只可能为2或64。 若 S等于2,账户名称中只包含字符‘0’和‘1’共2种字符; 若 S等于64,账户名称中可能包含大小写字母、数字、下划线以及'@'共64种字符。 随后 行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。
Output
仅一行一个正整数,表示共有多少对相似的账户名称。
枚举每个修改位置,对每个修改位置逐一把字符串的hash值插入一个hashmap中同时计数。
期望时间复杂度O(NL),但常数很大。
#include<cstdio> typedef unsigned long long lint; const lint PH=125959; int n,l,ts,ans(0); char s[210]; lint h1[30001][210],h2[30001][210]; lint hx[PH]; int hy[PH],hd[PH]; int now=1; int find(lint v){ int w=v%PH; while(hd[w]==now){ if(hx[w]==v)return hy[w]++; w+=43; if(w>=PH)w-=PH; } hx[w]=v; hy[w]=1; hd[w]=now; return 0; } int main(){ scanf("%d%d%d",&n,&l,&ts); for(int i=0;i<n;i++){ scanf("%s",s+1); lint*h1i=h1[i],*h2i=h2[i]; for(int j=1;j<=l;j++)h1i[j]=h1i[j-1]*313+s[j]; for(int j=l;j>=1;j--)h2i[j]=h2i[j+1]*757+s[j]; } for(int j=1;j<=l;j++,now++){ for(int i=0;i<n;i++)ans+=find(h1[i][j-1]*547+h2[i][j+1]*331); } printf("%d",ans); return 0; }