【AtCoder】ARC 081 E - Don't Be a Subsequence

【题意】给定长度为n(<=2*10^5)的字符串,求最短的字典序最小的非子序列字符串。

http://arc081.contest.atcoder.jp/tasks/arc081_c

【算法】字符串DP

【题解】

先考虑计算最短长度,再考虑求字典序最小。

关键在于发掘出【最短的非子序列字符串】具有最优子结构,定义f(s)为字符串s的最短的非子序列字符串长度,假设最短的非子序列字符串为t,当t的第一个字母是c(任意字母)时,只有两种情况:

①s中无c,f(s)=1最短。

②对于s中最左边位置p的c,f(s)=f(s.suffix(p+1))+1,最后这个+1就是c。

很熟悉对吗?①是终止条件,②是状态转移,满足最优子结构性质,当确定第一个字母后,剩余部分可以转化为计算完毕的子问题

那么正式定义状态转移方程,令f[i]表示字符串的后缀i的最短非子序列字符串的长度,pos[i][j]表示从位置i开始第一个字母j出现的位置。

状态转移方程:f[i]=min(f[pos[i][j]+1])+1,0<=j<26。

最后要求字典序最小,从f[0]开始对于每一步找到最小的字母c满足f[i]==f[pos[i][c]]+1输出即可。

复杂度O(n*26)。

考虑清楚边界问题!

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int maxn=200010;
int f[maxn],pos[maxn][30],n;
char s[maxn];
int main(){
    scanf("%s",s);
    n=strlen(s);
    for(int i=0;i<26;i++)pos[n][i]=n;
    f[n]=1;f[n+1]=0;//即使没有后缀仍然需要长度为1,f[n]=1;如果没有相同字符的话就f[n+1]+1,所以f[n+1]=0。 
    for(int i=n-1;i>=0;i--){
        for(int j=0;j<26;j++)pos[i][j]=pos[i+1][j];
        pos[i][s[i]-'a']=i;
        f[i]=n+1;
        for(int j=0;j<26;j++)f[i]=min(f[i],f[pos[i][j]+1]+1);
    }
    int T=f[0],p=0;
    while(T--){
        for(int j=0;j<26;j++)if(f[pos[p][j]+1]+1==f[p]){
            putchar('a'+j);
            p=pos[p][j]+1;
            break;
        }
    }
    return 0;
}
View Code

 

posted @ 2017-08-23 15:18  ONION_CYC  阅读(499)  评论(0编辑  收藏  举报