HEOI 2012 旅行问题

2746: [HEOI2012]旅行问题

Time Limit: 30 Sec  Memory Limit: 256 MB
Submit: 1009  Solved: 318
[Submit][Status][Discuss]

Description

yz是Z国的领导人,他规定每个地区的名字只能为26个小写拉丁字母的一个。由于地 区数有可能超过26个,便产生了一个问题,如何辨别名字相同的地区?于是yz规定,一个 地区的描述必须包含它的所有上级,且上级按次序排列。于是,一个地区的描述是一个字符 串。比如说,一个地区的名字为c,它的上级为b,b的上级为a,a没有上级,那么这个地 区就描述为abc。显然,这个描述同时包含了c的上级b和b的上级a的描述,分别为ab和a。 值得注意的是,每个地区最多有一个上级,同一上级的地区之间名字不同,没有上级的 地区之间名字不同。现在,yz对外公布了n个地区的描述,这些描述中包含了Z国所有地区的描述,并让 你处理来访者的旅行问题。现有m对人访问这个国家,对于每对人,第一个人喜欢第i个描述中的第j个地区,设 这个地区描述为s1,第二个人喜欢第k个描述中的第l个地区,设这个地区描述为s2。他们为了统一行程,决定访问描述为s的地区(显然他们只关心地区的名字,并非是地区本身), 设s的长度为t,s需要满足以下条件: 
1:t<=j, t<=l; 
1:s[1..t] = s1[j-t+1 … j], s[1..t] = s2[l-t+1 … l];(即s为s1中1到k位 与s2中1到l位的公共后缀) 
2:t最大化。 
为了不使输出过大,你只需把这个字符串按照如下生成的26进制数转成10进制后mod 1000000007后输出: 
a->0 
b->1 



z->25 
比如地区cab被编码成2 *    26? + 0 * 26? + 1 * 26? = 1353。 

Input

第一行给定一个整数n 
第2…n+1行:每i+1行给定一个字符串a[i],表示第i个描述。 
接下来一行一个整数m 
接下来m行:每行给定四个整数i,j,k,l,字母含义与题目描述一致。 

Output


共m行,每行一个整数,表示答案字符串的编码。 

Sample Input

2
aabb babb
2
1 3 2 3
1 4 2 4

Sample Output

1
1
【样例说明】
询问1中的公共后缀有ab和b,但是没有ab这个地区,只有b地区,所以只能选择b这个 地区;
询问2中的公共后缀有abb、bb和b,但是没有abb和bb这两个地区,只有b地区,所以 只能选择b这个地区。

HINT

 

【数据范围】


 设这个国家地区总数数为tot(注意:输入的字符串总长度可能超过tot!) 对于30%的数据,满足tot,m,n<=100; 

对于50%的数据,满足tot,m,n<=1000; 

对于80%的数据,满足tot,m,n<=100000; 

对于100%的数据,满足tot,m,n<=1000000; 

保证输入文件不超过20MB。 

 

1、AC自动机构造fail树,抽离fail树构图(失配指针指向的点 向 当前点 连边)

2、在fail树中找到 s1、s2 的结尾点,两点的lca就是答案

正确性分析:

fail指针定义:在其他串中找一个最长的  前缀等于这个串的后缀

在fail树构出的图中,沿fail指针向上跳所经过的点,一定是当前串的最长后缀

且越往上跳,后缀长度单调不上升

题目要求:两个串的最长公共后缀,且这个后缀是某个串的前缀

所以就是两个串的结尾点在fail树中的lca

 

这题卡空间,卡空间

数组范围抄的大佬的题解

 

1、lca

① 抽离fail树构图求lca时,因为空间有限,所以不选树链剖分,用倍增法

② 因为点的父节点就是失配指针指向的点,所以可以在求fail指针时,同时算出deep,f[i][0] 

③ 节省一个dfs 时间,所以倍增求lca时,选用根据深度判断的方法,而不是dfs序

          节省链表重新构图空间、时间,所以不用树链剖分、dfs序倍增法

2、锁定字符串末节点的位置

① 节省时间,不在AC自动机上匹配一遍,因为告诉了了第i个字符串的前j个,所以在insert字符串时,可以记录

② 节省空间,不用二维数组a[N][26]表示第i个字符串的第j个节点在AC自动机的什么位置

    因为是顺序插入,用一个st[i]数组,表示前i-1个字符串用了多少个节点,

    pos[i]数组,表示所有字符串的第i个字母在AC自动机的那个位置(第1个字符串的所有字母在最前面,然后是第2个字符串,第3、4……)

    这样第i个字符串的第j个字母在AC自动机中的位置就是 pos[st[i]+j]

    为什么要引入st数组?因为AC自动机相同前缀用同一个节点

 

代码中倍增求lca时,循环到了20,

我的理解:只需循环到log2(n)+1 ,因为倍增是2^i,i大了没用

但是 引入 int p=log(n)/log(2)+1;  就错了

(c++ 默认log函数以自然对数为底)

call 大佬求解

#include<cmath>
#include<queue>
#include<cstdio>
#include<cstring>
#include<algorithm>
#define N 1000010
#define mod 1000000007
 
using namespace std;
 
 
char s[N];
int pos[N*8],st[N],cnt;  //
int key[N];
int n,m,iid,len,root,p;
int tot=1,trie[N][26];
int ancestor[N][22],deep[N];
 
queue<int>q;
 
 
struct TREE
{
    void pre()
    {
        for(int i=1;i<=20;i++)
         for(int j=1;j<=tot;j++)
          ancestor[j][i]=ancestor[ancestor[j][i-1]][i-1];
    }
    int getlca(int u,int v)
    {
        if(deep[u]<deep[v]) swap(u,v);
        for(int i=0;i<=20;i++) 
         if((deep[u]-deep[v])&(1<<i)) u=ancestor[u][i];
        if(u==v) return u;
        for(int i=20;i>=0;i--)
         if(ancestor[u][i]!=ancestor[v][i]) 
         {
            u=ancestor[u][i];
            v=ancestor[v][i];
         }
        return ancestor[u][0];
    }
};
 
TREE tree;
 
struct ACautomata
{
    void insert(int k)
    {
        st[k]=cnt;
        len=strlen(s); root=1;
        for(int i=0;i<len;i++)
        {
            iid=s[i]-'a';
            if(!trie[root][iid]) 
            {
                trie[root][iid]=++tot;
                key[tot]=(1ll*key[root]*26+iid)%mod;
            }
            root=trie[root][iid];
            pos[++cnt]=root;
        }
    }
    void getfail()
    {
        for(int i=0;i<26;i++) trie[0][i]=1;
        q.push(1); 
        int now,j;
        while(!q.empty())
        {
            now=q.front();  q.pop();
            for(int i=0;i<26;i++)
            {
                if(!trie[now][i]) 
                {
                    trie[now][i]=trie[ancestor[now][0]][i];
                    continue;
                }
                q.push(trie[now][i]);
                j=ancestor[now][0];
                //while(!trie[j][i]) j=ancestor[j][0];
                ancestor[trie[now][i]][0]=trie[j][i];
                deep[trie[now][i]]=deep[trie[j][i]]+1;
            }
        }
    }
};
 
ACautomata AC;
 
int main()
{
    scanf("%d",&n);
//  int p=log(n)/log(2)+1;
    for(int i=1;i<=n;i++)
    {
        scanf("%s",s);
        AC.insert(i);
    }
    AC.getfail();
    tree.pre();
    scanf("%d",&m);
    int i,j,k,l,r1,r2,lca;
    while(m--)
    {
        scanf("%d%d%d%d",&i,&j,&k,&l);
        lca=tree.getlca(pos[st[i]+j],pos[st[k]+l]);
        printf("%d\n",key[lca]);
    }
}

 

posted @ 2017-06-10 22:02  TRTTG  阅读(354)  评论(0编辑  收藏  举报