[Scoi2016] 背单词
4567: [Scoi2016]背单词
Time Limit: 10 Sec Memory Limit: 256 MBSubmit: 1123 Solved: 476
[Submit][Status][Discuss]
Description
Lweb 面对如山的英语单词,陷入了深深的沉思,“我怎么样才能快点学完,然后去玩三国杀呢?”。这时候睿智
的凤老师从远处飘来,他送给了 Lweb 一本计划册和一大缸泡椒,他的计划册是长这样的:
—————
序号 单词
—————
1
2
……
n-2
n-1
n
—————
然后凤老师告诉 Lweb ,我知道你要学习的单词总共有 n 个,现在我们从上往下完成计划表,对于一个序号为 x
的单词(序号 1...x-1 都已经被填入):
1) 如果存在一个单词是它的后缀,并且当前没有被填入表内,那他需要吃 n×n 颗泡椒才能学会;
2) 当它的所有后缀都被填入表内的情况下,如果在 1...x-1 的位置上的单词都不是它的后缀,那么你吃 x 颗泡
椒就能记住它;
3) 当它的所有后缀都被填入表内的情况下,如果 1...x-1的位置上存在是它后缀的单词,所有是它后缀的单词中
,序号最大为 y ,那么你只要吃 x-y 颗泡椒就能把它记住。
Lweb 是一个吃到辣辣的东西会暴走的奇怪小朋友,所以请你帮助 Lweb ,寻找一种最优的填写单词方案,使得他
记住这 n 个单词的情况下,吃最少的泡椒。
Input
输入一个整数 n ,表示 Lweb 要学习的单词数。接下来 n 行,每行有一个单词(由小写字母构成,且保证任意单
词两两互不相同)1≤n≤100000, 所有字符的长度总和 1≤|len|≤510000
Output
Lweb 吃的最少泡椒数
Sample Input
2
a
ba
a
ba
Sample Output
2
题意:
出题人语文老师是哪位?出来挨打
大概意思就是给你$n$个字符串,让你给他们排序后计算代价。
对于第$i$个字符串:
- 如果这个字符串的后缀出现了并且排在他后面则代价为$n^2$。
- 如果这个字符串的后缀没有出现则代价为$i$。
- 如果这个字符串的后缀出现了并且排在他前面,设其下标为$j$,则代价为$i-j$。
题解:
首先,假如没有1条件存在,我们的代价最多是$\sum_{i=1}^{n}i=\frac{(1+n)n}{2}<n^2$。
也就是说出现一个1基本上就全tm完了。
那么发现按字符串长度排序就可以避免1的出现(没有重复字符串),所以1条件在这个题里根本没有用。
考虑到快速统计前缀可以建$Trie$树,那么快速统计后缀……可以反转串再建$Trie$树。
把树上所有的$end$节点按原祖先关系连起来得到一颗新树,
问题就变为给这个新树的节点编号使得$\sum_{i=1}^{n}num(i)-num(father(i))$最小。
这里有一个直觉性的结论:同一棵子树内的节点编号连续时最优。
这个问题严格证明我也不会可以简单证明:
假设红色部分是同一棵子树的节点,计算得出我们把红色部分移到一起时不会产生额外代价。
但是往后移动的部分如果是某个节点的父亲,那么那个节点的代价在这次移动后就会减少。
所以最终答案一定是将每棵子树内的节点排到了一起。
回想一下,$DFS$序的性质便是满足同一棵子树内的节点连续。所以我们按照$DFS$序编号较优。
根据排序不等式,可以得到:按子树$size$从小到大编号最优。(这个确实很容易证明,计算即可)
于是贪心过掉本题。
(我又一次手算数据出错了,开心)
代码:
#include<algorithm> #include<iostream> #include<cstring> #include<cstdio> #include<vector> using namespace std; #define MAXN 100005 #define MAXM 500005 #define INF 0x7fffffff #define ll long long inline int read(){ int x=0,f=1; char c=getchar(); for(;!isdigit(c);c=getchar()) if(c=='-') f=-1; for(;isdigit(c);c=getchar()) x=x*10+c-'0'; return x*f; } struct node{ int son[30]; bool ise; }tr[MAXM]; struct np{int u,v;}; vector<np> ntr[MAXM]; int N,num=1,cnt,ccnt,f[MAXM]; int hd[MAXM],siz[MAXM],p[MAXM]; int to[MAXM<<1],nxt[MAXM<<1]; int dfn[MAXM]; char str[MAXN]; inline void add(int n){ int len=strlen(str+1),u=1; for(int i=len;i>=1;i--){ int c=str[i]-'a'+1; if(!tr[u].son[c]) tr[u].son[c]=++num; u=tr[u].son[c]; } tr[u].ise=1,p[n]=u; } inline void addedge(int u,int v){ to[++cnt]=v,nxt[cnt]=hd[u],hd[u]=cnt; to[++cnt]=u,nxt[cnt]=hd[v],hd[v]=cnt; } inline void Dfs(int u,int las){ for(int i=1;i<=26;i++) if(tr[u].son[i]){ if(tr[tr[u].son[i]].ise){ addedge(las,tr[u].son[i]); Dfs(tr[u].son[i],tr[u].son[i]); } else Dfs(tr[u].son[i],las); } return; } inline bool cmp(np a,np b){return a.v<b.v;} inline void dfs(int u,int fa){ siz[u]=1;f[u]=fa; for(int i=hd[u];i;i=nxt[i]){ int v=to[i]; if(v==fa) continue; dfs(v,u); siz[u]+=siz[v]; np tp;tp.u=v,tp.v=siz[v]; ntr[u].push_back(tp); } sort(ntr[u].begin(),ntr[u].end(),cmp); return; } inline void ddfs(int x){ dfn[x]=++ccnt; for(int i=0;i<ntr[x].size();i++) ddfs(ntr[x][i].u); return; } int main(){ N=read(); ll ans=0; for(int i=1;i<=N;i++) scanf("%s",str+1),add(i); Dfs(1,1);dfs(1,0);ddfs(1); for(int i=1;i<=N;i++) ans+=dfn[p[i]]-dfn[f[p[i]]]; printf("%lld\n",ans); return 0; } /* 6 b ab aab aaab bab bcb */