[BZOJ]1031 字符加密Cipher(JSOI2007)

  持续划水中……

  感觉BZOJ上AC人数多的基本都是一些模板题,也就是某些算法的裸题。这些题目mark一下到时候回来复习也是不错的选择。

 

Description

  喜欢钻研问题的JS同学,最近又迷上了对加密方法的思考。一天,他突然想出了一种他认为是终极的加密办法:把需要加密的信息排成一圈,显然,它们有很多种不同的读法。例如下图,可以读作:

   

                JSOI07 SOI07J OI07JS I07JSO 07JSOI 7JSOI0
  把它们按照字符串的大小排序:07JSOI 7JSOI0 I07JSO JSOI07 OI07JS SOI07J
  读出最后一列字符:I0O7SJ,就是加密后的字符串(其实这个加密手段实在很容易破解,鉴于这是突然想出来的,那就^^)。但是,如果想加密的字符串实在太长,你能写一个程序完成这个任务吗?

Input

  输入文件包含一行,欲加密的字符串。注意字符串的内容不一定是字母、数字,也可以是符号等。

Output

  输出一行,为加密后的字符串。

Sample Input

  JSOI07

Sample Output

  I0O7SJ

HINT

  字符串的长度不超过100000。

 

Solution

  后缀数组裸题嘛,小C觉得没什么可说的。

  本质就是一个长度为2n字符串有n个长度为n的子串,将它们排序。

 

  不过在这里小C要好好讲一讲自己对于后缀数组O(nlogn)算法的理解。

  虽然一开始小C看这个算法时也是头皮发麻,但是仔细想想代码中的道理也是非常好理解的。

  后缀数组核心代码只有9行,其中4行预处理,1行倍增,4行正式处理,而且预处理部分和正式处理部分本质是相同的。

  具体参见小C代码后面的注释。

#include <cstdio>
#include <algorithm>
#include <cstring>
#define MN 200005
#define MS 256
using namespace std;
int mp[MN],rk[2][MN],sa[2][MN];
char c[MN];
int n,bn,K,g;

inline int read()
{
    int n=0,f=1; char c=getchar();
    while (c<'0' || c>'9') {if(c=='-')f=-1; c=getchar();}
    while (c>='0' && c<='9') {n=n*10+c-'0'; c=getchar();}
    return n*f;
}

void work(int* SA,int* RK,int* sa,int *rk)
{
    register int i;
    //正式处理部分:前3行以rk为第一关键字求出SA,后一行无脑求RK。(注意顺序) 
    for (i=1;i<=n;++i) mp[rk[sa[i]]]=i;  //不用前缀和,直接根据串x在sa中的排名得到mp[rk[x]]的前缀和。 
    for (i=n;i;--i) if (sa[i]>K) SA[mp[rk[sa[i]-K]]--]=sa[i]-K;
                            //对于扩展后长度大于K的后缀x,利用后缀x+K在sa中的排名得到x在SA中的排名。 
    for (i=n-K+1;i<=n;++i) SA[mp[rk[i]]--]=i;
                    //然后就只剩下扩展后长度小等于K的后缀x,排名一定比大于K的后缀小,所以后处理。 
    for (i=1;i<=n;++i) RK[SA[i]]=RK[SA[i-1]]+(rk[SA[i]]!=rk[SA[i-1]] || rk[SA[i]+K]!=rk[SA[i-1]+K]);
                                                                      //无脑求RK,注意用到sa。
    //为了执行效率的提高,通常在对后缀排序时,如果发现某次扩展后,所有后缀的rk都不相同,即可停止倍增。 
}

void prework()
{
    register int i;
    //预处理部分:前3行用基数排序求出sa[0],后1行无脑求rk[0]。 
    for (i=1;i<=n;++i) ++mp[c[i]];
    for (i=1;i<MS;++i) mp[i]+=mp[i-1];
    for (i=1;i<=n;++i) sa[0][mp[c[i]]--]=i;
    for (i=1;i<=n;++i) rk[0][sa[0][i]]=rk[0][sa[0][i-1]]+(c[sa[0][i]]!=c[sa[0][i-1]]);
                                //注意求rk的时候要按照sa的顺序。 
    //倍增部分:g代表数组滚动,K是扩展前的大小,扩展一次后sa内的后缀长度变为K*2。 
    for (g=0,K=1;K<=bn;K<<=1,g^=1) work(sa[g^1],rk[g^1],sa[g],rk[g]);
    //至于求height数组的话,只要记住height[rk[i]]>=height[rk[i-1]]这个性质就行了。 
}

int main()
{
    register int i;
    scanf("%s",c+1); n=strlen(c+1);
    for (i=1;i<=n;++i) c[n+i]=c[i];
    bn=n; n<<=1;
    prework(); c[0]=c[n];
    for (i=1;i<=n;++i) if (sa[g][i]<=bn) putchar(c[sa[g][i]-1]);
}

 

Last Word

  本来后缀数组是不亚于LCT困扰小C的存在,现在发现理解了就不需要那样死记硬背了。

  最后吐槽一下BZOJ上各种病句连篇的题面,在Blog上贴这种东西尴尬癌都要犯了。

posted @ 2017-07-02 02:11  ACMLCZH  阅读(188)  评论(0编辑  收藏  举报