HNOI2004 L语言
L语言
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。 一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’ 在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解 而且是在字典D下能够被理解的最长的前缀。 给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。 并给出其在字典D下能够被理解的最长前缀的位置。
Clove_unique的题解
DP的思路非常好想,就是\(f(i)\)表示前\(i\)个是不是合法的串,状态类似01背包,可以知道如果位置\(i\)减去任何一个后缀如果是合法的那\(f(i)\)一定是合法的,那么就建立AC自动机,每个位置跳last就可以了。
一次匹配的时间是1M,由于树的深度是10,所以总时间复杂度为\(O(20∗10∗1M)\)。
我实测bitset要慢一些……或许bitset只有空间上的优势。
co int N=201,S=1e6+1;
namespace AC
{
int tot;
int ch[N][26],val[N];
int fail[N],last[N];
void ins(char s[],int n)
{
int u=0;
for(int i=0;i<n;++i)
{
int k=s[i]-'a';
if(!ch[u][k])
ch[u][k]=++tot;
u=ch[u][k];
}
val[u]=n;
}
void getfail()
{
std::queue<int>Q;
for(int i=0;i<26;++i)
if(ch[0][i])
Q.push(ch[0][i]);
while(Q.size())
{
int u=Q.front();Q.pop();
last[u]=val[fail[u]]?fail[u]:last[fail[u]];
for(int i=0;i<26;++i)
{
if(ch[u][i])
{
fail[ch[u][i]]=ch[fail[u]][i];
Q.push(ch[u][i]);
}
else
ch[u][i]=ch[fail[u]][i];
}
}
}
bool f[S];
void solve(char s[],int n)
{
std::fill(f+1,f+n+1,0);
f[0]=1;
int u=0;
for(int i=0;i<n;++i)
{
int k=s[i]-'a';
int v=ch[u][k];
while(v)
{
f[i+1]=f[i+1]|f[i+1-val[v]];
v=last[v];
}
u=ch[u][k];
}
for(int i=n;i>=0;--i)
if(f[i])
{
printf("%d\n",i);
break;
}
}
}
char buf[S];
int main()
{
// freopen(".in","r",stdin);
// freopen(".out","w",stdout);
int n,m;
read(n),read(m);
for(int i=1;i<=n;++i)
{
scanf("%s",buf);
AC::ins(buf,strlen(buf));
}
AC::getfail();
for(int i=1;i<=m;++i)
{
scanf("%s",buf);
AC::solve(buf,strlen(buf));
}
return 0;
}
静渊以有谋,疏通而知事。