快速沃尔什变换(FWT)快速莫比乌斯变换(FMT)
虽然一点不懂,但是看着代码短得感人,背过就好了吧。
或
与
异或
代码实现
记忆
有些东西不用全靠硬背,可以有技巧地背
或
进行或运算,通常数会往大里走,所以较高位的数要加上较低位的数 (雾)
与
与 与 或 相反,通常数会往小里走,于是 是较低位的数加上较高位的数 (大雾)
异或
有点特殊? 有点像 FFT?那就记成 FFT 的形式就好了吧...
IFWT
IFWT 就是把 FWT 给还原一下就好了吧。
之前某位置加上了一个数,而现在那个数还没变 (大雾),那么就把那个数减掉就好了吧。
(对于异或)找不到之前那个数?没关系,可以列个方程解出来 (大雾)
注意!!
-
FWT不用倍长,不用蝴蝶变换
-
FWT里面还是尽量用<=比较安全,只要空间足够就没啥问题。特别注意一点:选取limit时要while (limi <= n)!!这时候一定要小于等于,否则不全!!
-
其余各项同ntt里面的注意
补充说明:
对于或卷积:(\(FWT:f[] -> f'[]\))
发现 \(f'[i]\) 为 \(i\) 的子集的权值和,因此可以做一些子集问题,如:P3175 [HAOI2015]按位或
子集卷积
给定\(a, b\)数组,令:
即在 \(k\) 中找到两个互不相交的子集 \(i,j\),计算 \(a_i * b_j\) 的总和
如果不要求互不相交,那么就是个 FWT_OR 的板子题了。如果要求互不相交,那么只需加上限制 \(|i| + |j| = |k|\)。
于是,我们可以枚举 \(|i|,|j|,|k|\),然后将所有大小为 \(|i|,|j|\) 的 \(|a_i|,|b_j|\) 的总和乘一块加给 \(c_k\),然后再将 \(c\) 数组卷回去,即为答案。
例题:P6570 [NOI Online #3 提高组]优秀子序列(民间数据)(洛谷数据可以被暴力水过,随机数据下本机也可过,但是CCF的评测机太慢,过不去)
例题:P4221 [WC2018]州区划分:自己卷自己的子集卷积。
7.29 Update:
从ztb那里学到的一些东西(对快速沃尔什变换的深入理解,后来发现似乎是快速莫比乌斯变换)
或卷积
我们定义一个高维前缀和数组:
我们发现如果这样的卷积符合 或卷积 的性质:
这样就可以 \(O(n)\) 乘法了。( \(n\) 为总状态数,或者说是\(2^{|U|}\))
如何求 \(\hat f(S)\) ? 可以使用高维前缀和的方法(for(维度i) for (所有状态S) S += S - i)
,其中 \(S - i\) 需要特判。复杂度 \(O(nlogn)\)。因此,如果我们直接枚举 \(S\) 中 \(i\) 两边的维度就可以使常数降为 \(1/2\)。
与卷积
我们定义一个类高维前缀和数组:
这个数组符合与卷积的性质:
代码实现就是反过来(0看作1,1看作0)做一遍高维前缀和。
异或卷积
这个就用不了 FMT 了。
我们定义一个根本不是前缀和的辅助数组:
然后艰难地寻找其有关卷积的性质:
看起来推不下去了?仔细观察 \(|S \& (A \wedge B)|\) 这个式子,想一想它和 \(|S \& A| + |S \& B|\) 的关系。
考虑按位拆分统计贡献(这显然是可行的),先刨除掉 \(S\) 没出现的位,考虑剩下的 \(S\) 出现的位。如果 \(a = b\),则 \(a \wedge b = 0\),对原式子的贡献是0,对后面的式子的贡献是偶数,因此等效;如果 \(a \not= b\),则 \(a \wedge b = 1\),对原式子的贡献是1,对后面的式子的贡献同样是1.
于是我们有了一个惊人的发现:\((-1)^{|S \& (A \wedge B)|} = (-1)^{|S \& A| + |S \& B|}\),于是可以继续推:
这样我们就可以快速推异或卷积了。
可是这个 \(\hat f(S)\) 怎么搞?总不能再高维前缀和了吧。实际上我们可以模仿 DFT ,分奇偶分组分治讨论。
一维一维地考虑。初始时(只考虑自己) \(\hat f(S) = (-1)^{|0 \& 0|}f(S) = f(S)\)。对于当前维度(首位)是0的那一组(左边的那一组),它的值应该是原来的左边对应的 \(\hat f\) 值(因为\(|0S \& 0S|=|S|\))再加上原来右边对应的 \(\hat f\) 值(因为\(|0S \& 1S|=|S|\));对于当前维度(首位)是1的那一组(右边),它的值应该是原来负的右边的对应的 \(\hat f\) 值(因为 \(|1S \& 1S| = |S| + 1\),只有右边的和右边的与才会 +1)再加上左边的对应的 \(\hat f\) 值(因为\(|1S \& 0S|=|S|\))。复杂度:\(O(nlogn)\)。
然后是逆变换。实际上还有个式子:
也比较好证,展开一下 \(\hat f_T\) ,再交换一下求和号可得:
右上角的式子很熟悉,它等于:\(|(S \wedge P) \& T|\),于是:
关键在于证得:
这是因为只要 \(Q\) 有一维有数,那么我们就可以摁着这一位,将 \(T\) 分成有这一位的和没有这一位的,这两类数量相同,且存在奇偶性不同的一一映射关系,然后式子就被消成 0 了。
然后就什么都好说了,这里就不再证了。
而这个 \(\frac{1}{2^n} \sum_T (-1)^{|S \& T|} \hat f_T\) 也好算,再来一遍 FWT ,最终除掉 \(1/2^n\) 即可(或者每层除以一个二也可)
(其实最简单的方法莫过于干了什么就“撤回”什么,可以直接推得沃尔什逆变换)。
小结
- 或:
意义:(同高维前缀和)\(S\) 的所有子集的和。
- 与:
意义:包含 \(S\) 的所有集合的和。
- 异或:
意义:?????
2021.3.31 Update
对异或卷积有了新的理解。
可能需要先了解一下集合幂级数的概念。可以在吕凯风的集训队论文中找到。
观察异或运算,其本质上是二进制不进位加法,那么下标上的异或运算就是做长度为 2 的循环卷积,可以使用 FFT。并且,\(\omega_2^0 = 1,\omega_2^1 = -1\),这两个单位根都是实数,于是就不用要求模数有原根了。
考虑 \(2^1\) 的情况,即一维的情况。假设原多项式为 \(f_0x^0 + f_1x^1\),暴力代入单位根,得到的新多项式为 \((f_0 + f_1)x^0 + (f_0 - f_1)x^1\)。
下面目前还不太理解。对于高维的情况,其 FFT 就是对每一维进行一遍 FFT。然后就得到了我们的 FWT 算法。
于是,我们不仅可以做 二维的不进位加法卷积,也可以做更高维的不进位加法卷积(如果模数友好存在那些单位根)
应用
4589: Hard Nim
经典Nim游戏(轮流取石子,无法操作者为负)。
n堆石子满足每堆石子的初始数量是不超过m的质数。
求先手必败局面数。
n <= 1e9, m <= 5e4
最朴素的方法自然是枚举每一种方案,判断其合法不合法。
复杂度:O(\(nm^n\))
当只有两个sigma(n=2)的时候是:
即
是异或卷积的形式。
(思维逐渐混乱)
根据FFT相关计数题目的经验,我们可以用权值数组。即 \(a[i]\) 表示异或值为 \(i\) 有多少种情况。然后就可以用FWT了。
考虑类似快速幂的方法,以快速幂的格式,把 \(a[~]\) 当作 \(x\),做多项式快速幂,最终答案就是 \(a[0]\)。复杂度大概\(O(m~logm~logn\))(有点悬?)
一想到多项式快速幂,我们就成功的走向了大弯路,甚至复杂度都有点保不住。不要忘记FFT,NTT,FWT都是借助点值表示加速的本质。在转化成点值表示以后,仍支持交换律,结合律等,因此可以直接把每个点值做快速幂。复杂度\(O(m~logm~+~m~logn)\)
\(Code:\)
limi = 1;
while (limi <= m) limi <<= 1;
for (register int i = 0; i <= m; ++i) A[i] = (!depri[i]);
FWT_xor(A, 1);
for (register int i = 0; i <= limi; ++i) A[i] = quickpow(A[i], n);
FWT_xor(A, -1);
printf("%lld\n", A[0]);
CF662C Binary Table
有一个 n 行 m 列的表格,每个元素都是 0/1 ,每次操作可以选择一行或一列,把 0/1 翻转,即把 0 换为 1 ,把 1 换为 0 。请问经过若干次操作后,表格中最少有多少个 1 。
\(n<=20, m<=1e5\)
考虑枚举行翻转情况为State。设一开始第 i 列的情况为 \(S_i\),则对于每个 \(State\) 来说,答案为(\(F_s\)表示某一列状态为 \(s\) 的最大贡献(1个数):
转换枚举对象: 枚举 对行操作后的列状态 X(方便直接使用 \(F_X\) 统计答案) 和 \(S_i\) (\(Q_s\) 表示状态为 \(S\) 的列有多少个):
稍作变换:
即:
然后预处理出 F 和 Q ,FWT即可。
练习题
附
FWT模板(调试用)
inline void FWT_or(ll *a, int type) {
for (register int i = 1; i < limi; i <<= 1) {
for (register int j = 0; j < limi; j += (i << 1)) {
for (register int p = 0; p < i; ++p) {
a[i + j + p] = (a[i + j + p] + a[j + p] * type) % P;
if (a[i + j + p] < 0) a[i + j + p] += P;
}
}
}
}
inline void sol_or() {
memcpy(tp1, A, sizeof(A));
memcpy(tp2, B, sizeof(B));
FWT_or(tp1, 1); FWT_or(tp2, 1);
for (register int i = 0; i < limi; ++i) C[i] = tp1[i] * tp2[i] % P;
FWT_or(C, -1);
for (register int i = 0; i < limi; ++i) printf("%lld ", C[i]);
puts("");
}
inline void FWT_and(ll *a, int type) {
for (register int i = 1; i < limi; i <<= 1) {
for (register int j = 0; j < limi; j += (i << 1)) {
for (register int p = 0; p < i; ++p) {
a[j + p] = (a[j + p] + a[i + j + p] * type) % P;
if (a[j + p] < 0) a[j + p] += P;
}
}
}
}
inline void sol_and() {
memcpy(tp1, A, sizeof(A));
memcpy(tp2, B, sizeof(B));
FWT_and(tp1, 1); FWT_and(tp2, 1);
for (register int i = 0; i < limi; ++i) C[i] = tp1[i] * tp2[i] % P;
FWT_and(C, -1);
for (register int i = 0; i < limi; ++i) printf("%lld ", C[i]);
puts("");
}
inline void FWT_xor(ll *a, int type) {
for (register int i = 1; i < limi; i <<= 1) {
for (register int j = 0; j < limi; j += (i << 1)) {
for (register int p = 0; p < i; ++p) {
ll nx = a[j + p], ny = a[i + j + p];
a[j + p] = (nx + ny) % P;
a[i + j + p] = (nx - ny + P) % P;
if (type == -1) {
a[j + p] = a[j + p] * inv2 % P;
a[i + j + p] = a[i + j + p] * inv2 % P;
}
}
}
}
}
inline void sol_xor() {
memcpy(tp1, A, sizeof(A));
memcpy(tp2, B, sizeof(B));
FWT_xor(tp1, 1); FWT_xor(tp2, 1);
for (register int i = 0; i < limi; ++i) C[i] = tp1[i] * tp2[i] % P;
FWT_xor(C, -1);
for (register int i = 0; i < limi; ++i) printf("%lld ", C[i]);
puts("");
}