L语言[HNOI2004]

【题目描述】
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。

一段文章 \(T\) 是由若干小写字母构成。一个单词 \(W\) 也是由若干小写字母构成。一个字典 \(D\) 是若干个单词的集合。 我们称一段文章 \(T\) 在某个字典 \(D\) 下是可以被理解的,是指如果文章 \(T\) 可以被分成若干部分,且每一个部分都是字典 \(D\) 中的单词。

例如字典 \(D\) 中包括单词 is , your , what , name ,则文章 whatisyourname 是在字典 \(D\) 下可以被理解的,因为它可以分成 4 个单词: what , is , your , name ,且每个单词都属于字典 \(D\),而文章 whatisyouname 在字典 \(D\) 下不能被理解,但可以在字典 D’=D+D’=D+you 下被理解。这段文章的一个前缀 whatis ,也可以在字典 \(D\) 下被理解,而且是在字典 \(D\) 下能够被理解的最长的前缀。

给定一个字典 \(D\) ,你的程序需要判断若干段文章在字典 \(D\) 下是否能够被理解。 并给出其在字典 \(D\) 下能够被理解的最长前缀的位置。

【输入格式】
输入文件第一行是两个正整数 \(n\)\(m\),表示字典 \(D\) 中有 \(n\) 个单词,且有 \(m\) 段文章需要被处理。

之后的 \(n\) 行每行描述一个单词,再之后的 \(m\) 行每行描述一段文章。

【输出格式】
对于输入的每一段文章,你需要输出这段文章在字典 \(D\) 可以被理解的最长前缀的位置。

题解

朴素想法就是在Trie上一直尽量向下匹配,然后失配了就从失配的地方开始重新从根匹配,然而这个错了

反例很好找

3 1
road
you
your
youroad

这样暴力匹配的话到了your会失配 然后并没有与oad匹配的词
但是youroad应该是能被全部理解的

所以我们发现对于每个能成功匹配的前缀,都要从它后面开始搜一次
这个例子中前缀13及14都是能匹配上的 如果从1~3后面 即4开始搜的话就能全部匹配

所以记录一个ok数组 \(ok[i]\)表示\(1\sim i\)的前缀能成功匹配

时间复杂度\(O(玄学)\) 蒟蒻不会分析

【代码】

#include <bits/stdc++.h>
using namespace std;

char s[1000005];
int n, m, tr[10005][30], tag[10005], tot, len; 
bool ok[1000005];

inline void insert(char *str, int l) {
	int now = 0;
	for (int i = 1; i <= l; i++) {
		if (!tr[now][str[i]-'a']) tr[now][str[i]-'a'] = ++tot;
		now = tr[now][str[i]-'a'];
	}
	tag[now] = 1;
}

inline void query(char *str, int st, int l) {
	int now = 0;
	for (int i = st; i <= l; i++) {
		if (!tr[now][str[i]-'a']) break;
		now = tr[now][str[i]-'a'];
		if (tag[now]) ok[i] = 1;
	}
}

int main() {
	scanf("%d%d", &n, &m);
	for (int i = 1; i <= n; i++) {
		scanf("%s", s+1); len = strlen(s+1);
		insert(s, len);
	}
	for (int i = 1; i <= m; i++) {
		memset(ok, 0, sizeof(ok)); ok[0] = 1;
		scanf("%s", s+1); len = strlen(s+1); 
		for (int j = 1; j <= len; j++) {
			if (ok[j-1]) query(s, j, len);
		}
		for (int j = len; j >= 0; j--) {
			if (ok[j]) {
				printf("%d\n", j); break;
			}
		}
	}
	return 0;
}
posted @ 2020-02-05 20:50  AK_DREAM  阅读(315)  评论(0编辑  收藏  举报