[Scoi2016] 背单词

4567: [Scoi2016]背单词

Time Limit: 10 Sec Memory Limit: 256 MB
Submit: 1123 Solved: 476
[Submit][Status][Discuss]

Description

Lweb 面对如山的英语单词,陷入了深深的沉思,“我怎么样才能快点学完,然后去玩三国杀呢?”。这时候睿智
的凤老师从远处飘来,他送给了 Lweb 一本计划册和一大缸泡椒,他的计划册是长这样的:
—————
序号  单词
—————
 1
 2
……
n-2
n-1
 n
—————
 
然后凤老师告诉 Lweb ,我知道你要学习的单词总共有 n 个,现在我们从上往下完成计划表,对于一个序号为 x 
的单词(序号 1...x-1 都已经被填入):
1) 如果存在一个单词是它的后缀,并且当前没有被填入表内,那他需要吃 n×n 颗泡椒才能学会;
2) 当它的所有后缀都被填入表内的情况下,如果在 1...x-1 的位置上的单词都不是它的后缀,那么你吃 x 颗泡
椒就能记住它;
3) 当它的所有后缀都被填入表内的情况下,如果 1...x-1的位置上存在是它后缀的单词,所有是它后缀的单词中
,序号最大为 y ,那么你只要吃 x-y 颗泡椒就能把它记住。
Lweb 是一个吃到辣辣的东西会暴走的奇怪小朋友,所以请你帮助 Lweb ,寻找一种最优的填写单词方案,使得他
记住这 n 个单词的情况下,吃最少的泡椒。
 

Input

输入一个整数 n ,表示 Lweb 要学习的单词数。接下来 n 行,每行有一个单词(由小写字母构成,且保证任意单
词两两互不相同)1≤n≤100000, 所有字符的长度总和 1≤|len|≤510000
 

Output

 Lweb 吃的最少泡椒数

 

Sample Input

2
a
ba

Sample Output

2

 

题意:

出题人语文老师是哪位?出来挨打

大概意思就是给你$n$个字符串,让你给他们排序后计算代价。

对于第$i$个字符串:

  1. 如果这个字符串的后缀出现了并且排在他后面则代价为$n^2$。
  2. 如果这个字符串的后缀没有出现则代价为$i$。
  3. 如果这个字符串的后缀出现了并且排在他前面,设其下标为$j$,则代价为$i-j$。

 

题解:

首先,假如没有1条件存在,我们的代价最多是$\sum_{i=1}^{n}i=\frac{(1+n)n}{2}<n^2$。

也就是说出现一个1基本上就全tm完了。

那么发现按字符串长度排序就可以避免1的出现(没有重复字符串),所以1条件在这个题里根本没有用。

考虑到快速统计前缀可以建$Trie$树,那么快速统计后缀……可以反转串再建$Trie$树。

把树上所有的$end$节点按原祖先关系连起来得到一颗新树,

问题就变为给这个新树的节点编号使得$\sum_{i=1}^{n}num(i)-num(father(i))$最小。

这里有一个直觉性的结论:同一棵子树内的节点编号连续时最优。

这个问题严格证明我也不会可以简单证明:

假设红色部分是同一棵子树的节点,计算得出我们把红色部分移到一起时不会产生额外代价。

但是往后移动的部分如果是某个节点的父亲,那么那个节点的代价在这次移动后就会减少。

所以最终答案一定是将每棵子树内的节点排到了一起。

回想一下,$DFS$序的性质便是满足同一棵子树内的节点连续。所以我们按照$DFS$序编号较优。

根据排序不等式,可以得到:按子树$size$从小到大编号最优。(这个确实很容易证明,计算即可)

于是贪心过掉本题。

我又一次手算数据出错了,开心

 

代码:

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cstdio>
#include<vector>

using namespace std;
#define MAXN 100005
#define MAXM 500005
#define INF 0x7fffffff
#define ll long long

inline int read(){
    int x=0,f=1;
    char c=getchar();
    for(;!isdigit(c);c=getchar())
        if(c=='-')
            f=-1;
    for(;isdigit(c);c=getchar())
        x=x*10+c-'0';
    return x*f;
}

struct node{
    int son[30];
    bool ise;
}tr[MAXM];
struct np{int u,v;};
vector<np> ntr[MAXM];
int N,num=1,cnt,ccnt,f[MAXM];
int hd[MAXM],siz[MAXM],p[MAXM];
int to[MAXM<<1],nxt[MAXM<<1];
int dfn[MAXM]; char str[MAXN]; 

inline void add(int n){
    int len=strlen(str+1),u=1;
    for(int i=len;i>=1;i--){
        int c=str[i]-'a'+1;
        if(!tr[u].son[c]) 
            tr[u].son[c]=++num;
        u=tr[u].son[c];
    }
    tr[u].ise=1,p[n]=u;
}

inline void addedge(int u,int v){
    to[++cnt]=v,nxt[cnt]=hd[u],hd[u]=cnt;
    to[++cnt]=u,nxt[cnt]=hd[v],hd[v]=cnt;
}

inline void Dfs(int u,int las){
    for(int i=1;i<=26;i++)
        if(tr[u].son[i]){
            if(tr[tr[u].son[i]].ise){
                addedge(las,tr[u].son[i]);
                Dfs(tr[u].son[i],tr[u].son[i]);
            }
            else Dfs(tr[u].son[i],las);
        }
    return;
}

inline bool cmp(np a,np b){return a.v<b.v;}

inline void dfs(int u,int fa){
    siz[u]=1;f[u]=fa;
    for(int i=hd[u];i;i=nxt[i]){
        int v=to[i];
        if(v==fa) continue;
        dfs(v,u); siz[u]+=siz[v];
        np tp;tp.u=v,tp.v=siz[v];
        ntr[u].push_back(tp);
    }
    sort(ntr[u].begin(),ntr[u].end(),cmp);
    return;
}

inline void ddfs(int x){
    dfn[x]=++ccnt;
    for(int i=0;i<ntr[x].size();i++)
        ddfs(ntr[x][i].u);
    return;
}

int main(){
    N=read(); ll ans=0;
    for(int i=1;i<=N;i++)
        scanf("%s",str+1),add(i);
    Dfs(1,1);dfs(1,0);ddfs(1);
    for(int i=1;i<=N;i++)
        ans+=dfn[p[i]]-dfn[f[p[i]]];
    printf("%lld\n",ans);
    return 0;
}
/*
6
b
ab
aab
aaab
bab
bcb
*/

 

posted @ 2019-02-19 17:23  Fugtemypt  阅读(149)  评论(0编辑  收藏  举报