主要内容:
1.哈希
2.KMP与扩展kmp算法
3. Manacher算法
哈希与哈希表
定义:
1.使用一个哈希函数将某个特定的数字变成另一个数字,这种操作称之为hash
2.通常我们会以取模运算来作为哈希函数
tips:
1.哈希冲突,不能保证每个元素的关键字与函数值是一 一对应的,这样就产生了“冲突”
Hash(哈希)的具体详解在 https://www.cnblogs.com/boranhoushen/p/16467767.html 里,可对照看.
核心代码:
字符串Hash
子串hash:
前缀和求哈希值:
子串[l, r]哈希值:
例题:
P4503 [CTSC2014]企鹅QQ
题目背景
PenguinQQ 是中国最大、最具影响力的 SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。
题目描述
小 Q 是 PenguinQQ 网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如 Penguin1,Penguin2,Penguin3……于是小 Q 决定先对这种相似的情形进行统计。
小 Q 定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小 Q 想知道,在给定的 nn 个账户名称中,有多少对是相似的。
为了简化你的工作,小Q给你的N 个字符串长度均等于L ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。
输入格式
第一行包含三个正整数 N,L,SN,L,S。其中 NN 表示账户名称数量,LL 表示账户名称长度,SS 用来表示字符集规模大小,它的值只可能为 22 或 6464。
若 SS 等于 22,账户名称中只包含字符 0
和 1
共 22 种字符;
若 SS 等于 6464,账户名称中可能包含大小写字母、数字、下划线以及 @
共 6464 种字符。
随后 NN 行,每行一个长度为 LL 的字符串,用来描述一个账户名称。数据保证 NN 个字符串是两两不同的。
输出格式
仅一行一个正整数,表示共有多少对相似的账户名称。
输入输出样例
4 3 64 Fax fax max mac
4
#include<bits/stdc++.h> #define ll long long using namespace std; const int p = 2333; int n,l,s; ll ha[30005],t[30005],Hina[205]; char c[300005][205]; int main() { scanf("%d%d%d",&n,&l,&s); for (int i = 1; i <= n; i++) { for (int j = 1; j <= l; j++) { cin >> c[i][j]; ha[i] = ha[i] * p + c[i][j]; } } Hina[0] = 1; for (int i = 1; i <= l; i++) { Hina[i] = Hina[i - 1] * p; } int ans = 0; for (int i = 1; i <= l; i++) { for (int j = 1; j <= n; j++) { t[j] = ha[j] - c[j][i] * Hina[l - i]; } sort(t + 1,t + n + 1); int tmp = 1; for (int j = 1; j < n; j++) { if (t[j] != t[j + 1]) tmp = 1; else { ans += tmp; tmp++; } } } printf("%d\n",ans); return 0; }
因本蒟蒻太蒟蒻KMP没学会,后续学会后再补充