P1357 花园 (矩阵快速幂优化 dp)
矩阵快速幂优化 dp
考虑 dp。观察到 \(m\) 范围很小,可以设 \(f_{i,s}\) 表示考虑完前 \(i\) 个,\([i-m+1,i]\) 的花盆状态为二进制数 \(s\)。
转移时 \(i-1\) 的 \(s\) 只有两种情况,其中一种需要判断合法。于是就有了复杂度 \(O(n2^5)\) 的做法。
考虑优化。把所有 \(f_{i,s}\) 看为 \(F_i\),可以预处理出 \(T_{s,t}\) 矩阵表示 \(s\) 到 \(t\) 是否可转移。那么转移可以写成 \(F_i=F_{i-1}\times T\)。可以矩阵快速幂优化转移。
这里还没有解决环形的问题,可以看成 \(f_{0,s}=f_{n,s}\),每次只给 \(f_{0,s}\) 赋初值。更简单的方法是省去 \(f\) 数组,求 \(T^n\) 即可,因为这里 \(T\) 数组每个位置 \(T_{i,j}\) 的意义就是 \(i\) 转移到 \(j\) 的方案数,那么答案就是 \(\sum_{i=0}^{lim} T_{i,i}\)。
复杂度 \(O((2^m)^3\log n)\)。
#include <bits/stdc++.h>
#define pii std::pair<int, int>
#define fi first
#define se second
#define pb push_back
using i64 = long long;
using ull = unsigned long long;
const i64 iinf = 0x3f3f3f3f, linf = 0x3f3f3f3f3f3f3f3f;
const int N = 40, mod = 1e9 + 7;
i64 n, m, k, lim, ans;
int popcnt[N];
struct Mat {
i64 m[N][N];
void clear() {
for(int i = 0; i < lim; i++) {
for(int j = 0; j < lim; j++) m[i][j] = 0;
}
}
void reset() {
for(int i = 0; i < lim; i++) {
for(int j = 0; j < lim; j++) m[i][j] = (i == j);
}
}
friend Mat operator * (Mat a, Mat b) {
Mat ret;
ret.clear();
for(int i = 0; i < lim; i++) {
for(int j = 0; j < lim; j++) {
for(int k = 0; k < lim; k++) {
ret.m[i][j] = (ret.m[i][j] + a.m[i][k] * b.m[k][j]) % mod;
}
}
}
return ret;
}
friend Mat operator ^ (Mat a, i64 b) {
Mat ret;
ret.reset();
while(b) {
if(b & 1) ret = ret * a;
a = a * a;
b >>= 1;
}
return ret;
}
} tmp;
void solve() {
std::cin >> n >> m >> k;
lim = (1 << m);
for(int i = 0; i < lim; i++) {
popcnt[i] = popcnt[i >> 1] + (i & 1);
}
for(int i = 0; i < lim; i++) {
if(popcnt[i] > k) continue;
int j1 = (i >> 1), j2 = (i >> 1) | (1 << (m - 1));
tmp.m[j1][i] = 1;
if(popcnt[j2] <= k) tmp.m[j2][i] = 1;
}
tmp = tmp ^ n;
for(int i = 0; i < lim; i++) if(popcnt[i] <= k) ans = (ans + tmp.m[i][i]) % mod;
std::cout << ans << "\n";
}
int main() {
std::ios::sync_with_stdio(false);
std::cin.tie(nullptr);
solve();
return 0;
}