[CF1473G] Tiles
\(\text{Problem}:\)Tiles
\(\text{Solution}:\)
用每一组的第 \(1\) 列(例如,第一组为第 \(1\) 列,第二组为第 \(1+a_{1}+b_{1}\) 列,第 \(n+1\) 组为最后一列)代表这一组,故下文的第 \(i\) 组,若无特殊说明,默认指第 \(i\) 组的第 \(1\) 列。
设 \(f_{i,j}\) 表示到第 \(i\) 组第 \(j\) 行(从下往上)的方案数,边界条件为 \(f_{1,1}=1\)。
根据定义,若第 \(i+1\) 列格子个数大于第 \(i\) 列,则从第 \(i\) 列的每一行可以向右或右上走;若第 \(i+1\) 列格子个数小于第 \(i\) 列,则从第 \(i\) 列的每一行可以向右或右下走。故有转移:
发现枚举 \(x\) 的复杂度过高,难以接受。考虑变换组合数,有:
注意到现在 \(\sum_{x}\) 是一个范德蒙德卷积形式,得到:
设 \(g_{i,j}=\binom{a_{i}+b_{i}}{b_{i}+j}\),将 \(g\) 代入 \(f\) 的转移式,有:
可以利用 \(\text{NTT}\) 优化转移过程。注意这里 \(j<k\) 的转移也是可行的,故要对 \(g_{i-1}\) 整体右移,最后的答案再左移给到 \(f\)。
发现 \(\lvert a_{i}-b_{i}\rvert\leq 5\),即每一组的行数最多只有 \(5n\) 级别,则总时间复杂度为 \(O(n^2\log n)\),可以通过本题。
\(\text{Code}:\)
#include <bits/stdc++.h>
#pragma GCC optimize(3)
//#define int long long
#define ri register
#define mk make_pair
#define fi first
#define se second
#define pb push_back
#define eb emplace_back
#define is insert
#define es erase
#define vi vector<int>
#define vpi vector<pair<int,int>>
using namespace std; const int N=2010, M=200010, Mod=998244353;
inline int read()
{
int s=0, w=1; ri char ch=getchar();
while(ch<'0'||ch>'9') { if(ch=='-') w=-1; ch=getchar(); }
while(ch>='0'&&ch<='9') s=(s<<3)+(s<<1)+(ch^48), ch=getchar();
return s*w;
}
int n,a[N],b[N],up[N],fac[M+5],inv[M+5];
vector<int> F,G;
int rev[M],r[24][2];
inline int ksc(int x,int p) { int res=1; for(;p;p>>=1, x=1ll*x*x%Mod) if(p&1) res=1ll*res*x%Mod; return res; }
inline int C(int x,int y) { if(x<y||x<0||y<0) return 0; return 1ll*fac[x]*inv[x-y]%Mod*inv[y]%Mod; }
inline void Get_Rev(int T) { for(ri int i=0;i<T;i++) rev[i]=(rev[i>>1]>>1)|((i&1)?(T>>1):0); }
inline void DFT(int T,vector<int> &s,int type)
{
for(ri int i=0;i<T;i++) if(rev[i]<i) swap(s[i],s[rev[i]]);
for(ri int i=2,cnt=1;i<=T;i<<=1,cnt++)
{
int wn=r[cnt][type];
for(ri int j=0,mid=(i>>1);j<T;j+=i)
{
for(ri int k=0,w=1;k<mid;k++,w=1ll*w*wn%Mod)
{
int x=s[j+k], y=1ll*w*s[j+mid+k]%Mod;
s[j+k]=(x+y)%Mod;
s[j+mid+k]=x-y;
if(s[j+mid+k]<0) s[j+mid+k]+=Mod;
}
}
}
if(!type) for(ri int i=0,inv=ksc(T,Mod-2);i<T;i++) s[i]=1ll*s[i]*inv%Mod;
}
inline void NTT(int n,int m,vector<int> &A,vector<int> B)
{
int len=n+m;
int T=1;
while(T<=len) T<<=1;
Get_Rev(T);
A.resize(T), B.resize(T);
DFT(T,A,1), DFT(T,B,1);
for(ri int i=0;i<T;i++) A[i]=1ll*A[i]*B[i]%Mod;
DFT(T,A,0);
}
signed main()
{
r[23][1]=ksc(3,119), r[23][0]=ksc(ksc(3,Mod-2),119);
for(ri int i=22;~i;i--) r[i][0]=1ll*r[i+1][0]*r[i+1][0]%Mod, r[i][1]=1ll*r[i+1][1]*r[i+1][1]%Mod;
fac[0]=1;
for(ri int i=1;i<=M;i++) fac[i]=1ll*fac[i-1]*i%Mod;
inv[M]=ksc(fac[M],Mod-2);
for(ri int i=M;i;i--) inv[i-1]=1ll*inv[i]*i%Mod;
n=read();
for(ri int i=1;i<=n;i++) a[i]=read(), b[i]=read();
up[1]=1;
for(ri int i=2;i<=n+1;i++) up[i]=up[i-1]+a[i-1]-b[i-1];
F.resize(2), F[1]=1;
for(ri int i=2;i<=n+1;i++)
{
vector<int>().swap(G);
G.resize(up[i-1]+up[i]+1);
for(ri int j=0;j<=up[i-1]+up[i];j++)
G[j]=C(a[i-1]+b[i-1],b[i-1]+j-up[i-1]);
NTT(F.size()-1,G.size()-1,F,G);
for(ri int j=up[i-1];j<=up[i-1]+up[i];j++) F[j-up[i-1]]=F[j];
F[0]=0;
F.erase(F.begin()+up[i]+1,F.end());
}
int ans=0;
for(ri int i=1;i<=up[n+1];i++) ans=(ans+F[i])%Mod;
printf("%d\n",ans);
return 0;
}
后记:具体是什么原因我也不清楚,但是这份代码用 c++17 或 c++17(64) 能跑过,c++11 或 c++14 就会 TLE。如果有了解这一情况的朋友请在评论区指出一下问题,谢谢!