主要内容:

1.哈希
2.KMP与扩展kmp算法
3. Manacher算法

哈希与哈希表

定义:

1.使用一个哈希函数将某个特定的数字变成另一个数字,这种操作称之为hash

2.通常我们会以取模运算来作为哈希函数

tips:

1.哈希冲突,不能保证每个元素的关键字与函数值是一 一对应的,这样就产生了“冲突”

Hash(哈希)的具体详解在  https://www.cnblogs.com/boranhoushen/p/16467767.html  里,可对照看.

核心代码:

 

 字符串Hash

 

 子串hash:

前缀和求哈希值:

 

子串[l, r]哈希值:

 

 例题:

P4503 [CTSC2014]企鹅QQ

题目背景

PenguinQQ 是中国最大、最具影响力的 SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。

题目描述

小 Q 是 PenguinQQ 网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如 Penguin1,Penguin2,Penguin3……于是小 Q 决定先对这种相似的情形进行统计。

小 Q 定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如“Penguin1”和“Penguin2”是相似的,但“Penguin1”和“2Penguin”不是相似的。而小 Q 想知道,在给定的 nn 个账户名称中,有多少对是相似的。

为了简化你的工作,小Q给你的N 个字符串长度均等于L ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

输入格式

第一行包含三个正整数 N,L,SN,L,S。其中 NN 表示账户名称数量,LL 表示账户名称长度,SS 用来表示字符集规模大小,它的值只可能为 22 或 6464。

若 SS 等于 22,账户名称中只包含字符 0 和 1 共 22 种字符;

若 SS 等于 6464,账户名称中可能包含大小写字母、数字、下划线以及 @ 共 6464 种字符。

随后 NN 行,每行一个长度为 LL 的字符串,用来描述一个账户名称。数据保证 NN 个字符串是两两不同的。

输出格式

仅一行一个正整数,表示共有多少对相似的账户名称。

输入输出样例

输入 #1
4 3 64
Fax
fax
max
mac
输出 #1
4
#include<bits/stdc++.h>
#define ll long long
using namespace std;
const int p = 2333;
int n,l,s;
ll ha[30005],t[30005],Hina[205];
char c[300005][205];
int main() {
    scanf("%d%d%d",&n,&l,&s);
    for (int i = 1; i <= n; i++) {
        for (int j = 1; j <= l; j++) {
            cin >> c[i][j];
            ha[i] = ha[i] * p + c[i][j];
        }
    }
    Hina[0] = 1;
    for (int i = 1; i <= l; i++) {
        Hina[i] = Hina[i - 1] * p;
    }
    int ans = 0;
    for (int i = 1; i <= l; i++) {
        for (int j = 1; j <= n; j++) {
            t[j] = ha[j] - c[j][i] * Hina[l - i];
        }
        sort(t + 1,t + n + 1);
        int tmp = 1;
        for (int j = 1; j < n; j++) {
            if (t[j] != t[j + 1]) tmp = 1;
            else {
                ans += tmp;
                tmp++;
            }
        }
    }
    printf("%d\n",ans);
    return 0;
}

因本蒟蒻太蒟蒻KMP没学会,后续学会后再补充