[TJOI2010] 阅读理解

洛谷

题意:给定\(N\)篇短文,每篇短文由\(L\)个单词组成,且只含小写字母;做\(M\)次询问,每次给定一个单词,求该单词在哪几篇短文中出现过。对于 \(100\%\) 的数据,\(1\le M\le 10^4\)\(1\le N\le 10^3\) 。每篇短文长度(含相邻单词之间的空格)\(\le 5\times 10^3\) 字符,每个单词长度 \(\le 20\) 字符。

分析:接近于Trie字典树的模板题,建树的时候对于每个单词的尾节点,开一个\(vector\)数组记录属于哪些文章,注意可能同一篇短文出现同一个单词多次,这时只要插入一次短文的编号。查询的时候直接输出单词尾节点的\(vector\)数组内容即可。本题最奇怪的点在于数组大小,表面上最多可能会有\(5e6\)个字符,而且每个字符都要有一个26个小写字母的指针域,但是这样建肯定会\(MLE\),实际上肯定会有相同的字符共用一个节点,因此达不到\(5e6\),建\(1e6\)就好了。

#include<bits/stdc++.h>
using namespace std;
#define ll long long
inline int read(){
    int x=0,o=1;char ch=getchar();
    while(ch!='-'&&(ch<'0'||ch>'9'))ch=getchar();
    if(ch=='-')o=-1,ch=getchar();
    while(ch>='0'&&ch<='9')x=x*10+ch-'0',ch=getchar();
    return x*o;
}
const int N=1e6+5;
const int M=3e5+5;
const int mod=998244353; 
int tot,ch[N][30];
vector<int>q[N];
void insert(string s,int num){
    int u=0;
    int len=s.size();
    for(int i=0;i<len;i++){
		int c=s[i]-'a';
		if(!ch[u][c])ch[u][c]=++tot;
		u=ch[u][c];
    }
    if(q[u].empty()||q[u][q[u].size()-1]!=num)q[u].push_back(num);
    return;
}
void find(string s){
	int len=s.size();
    int u=0;
    for(int i=0;i<len;i++){
    	int c=s[i]-'a';
        if(!ch[u][c]){
        	cout<<endl;
        	return;
		}
        u=ch[u][c];
    }
    for(int i=0;i<q[u].size();++i)cout<<q[u][i]<<" ";
	cout<<endl;
	return;
}
int main(){
    int n=read();
	for(int i=1;i<=n;++i){
		int L=read();
		for(int j=1;j<=L;++j){
			string s;
			cin>>s;
			insert(s,i);
		}
	}
	int m=read();
	for(int i=1;i<=m;++i){
		string s;
		cin>>s;
		find(s);
	}
    return 0;
}

posted on 2023-03-04 15:07  PPXppx  阅读(20)  评论(0编辑  收藏  举报