正如 EI 所言啊,转置原理不是无中生有创造算法,而是建立了一些问题之间的转化机制。
问题形式:
考虑一个 \(n\times m\) 的矩阵 \(A\),我们有一个算法:输入长度为 \(m\) 的向量 \(b\),可以利用这个算法得到 \(A\times b\) 的结果:一个长度为 \(n\) 的向量 \(a\)。
如果在这个算法过程中,对输入的修改都是线性修改,那么转置原理断言:存在一个复杂度相同的算法,使得,输入长度为 \(n\) 的向量 \(a\),可以得到 \(A^{T}\times a\) 的结果:一个长度为 \(m\) 的向量 \(b\)。
需要注意是,这个东西,并不是反解方程的结果啊,前后两次的 \(a,b\) 没啥关系。
解决方案
考虑所有和输入有关的项,其它项就都应该成为常数项:换言之它们在输入之前就应该预先处理完毕。
此时原问题的每一步骤,都应该是对输入的线性修改。
因为是线性修改,所以可以看成,将输入数据左乘上了一个矩阵。
换言之 \(A\times b\) 应该可以分解成 \(A_k\times ... \times A_1 b\),每一个 \(A_i\) 都对应了算法流程中的一个操作。
我们知道 \(A^T=A_1^T\times ... \times A_k^T\),而每一个 \(A_i\) 本质上,是对输入数据的一些操作。
那么你倒着做原算法的操作,并且每一步操作,都“做原操作的转置”,就可以得到答案。
什么叫做原操作的转置?我们举一些例子(事实上转置原理这部分,你都可以把操作写成矩阵形式,然后把矩阵转置一下就行)。
- 例如:\(a_i\leftarrow a_i + c\times a_j\)。
写成矩阵的形式:
然后把最左边的 \(2\times 2\) 矩阵转置,重新做乘法,就得到:\(a_j\leftarrow c\times a_i+a_j\)。
那你就得到了 \(a_i\leftarrow a_i+c\times a_j\) 这个操作对应的转置。
卷积不是线性的,但是如果两个相乘的数组,一个是确定的,那么就可以认为是线性的。从线性代数的角度来看,无非就是:
这个乘法等价于卷积:\(a_i=\sum_{j\le i}b_j\times c_{i-j}\)。
这个运算就等价于 \(b_i=\sum_{j\ge i}c_{j-i}\times a_j\)。
我们发现和卷积的转置就是我们也很熟悉的差卷积的形式。
我们一般把这里的矩阵记作 \(mul(c)\),其转置就是 \(mulT(c)\)
经典应用:多项式多点求值
方便起见,我们假设询问的点的个数和多项式次数相同。
令输入的点值是常数,而多项式系数是真正的输入,输出为多项式在 \(n\) 个点的值。
首先多项式多点求值相当于左乘一个范德蒙德矩阵,这个问题转置是可以做的。
怎么做呢,直接求结果向量单个位置是不好做的,但是把每个位置的生成函数写出来会发现是 \(n\) 个一次分式的和,这就可以 \(O(n\log^2 n)\) 通分了。
而且分母和输入的多项式无关,那么可以把分治结构预处理出来,每一个位置的分母都处理一下。
然后倒着做原操作的转置就行了,你会发现这里就运用了一个东西:和卷积的转置是差卷积。
时间复杂度 \(O(n\log^2 n)\)。