脑力体操: 半在线卷积能做到多好? (van der Hoeven, 2007)

固定一个可以 $O (1)$ 运算的 effective field $K$ , 并且假设其上的 FFT 时间复杂度为 $O (N \log N)$ . 有序列 ${g}$ 和 ${ϕ}$ , 如何计算半在线卷积 $f_{n} = ϕ_{n} (\sum_{i > 0} g_{i} f_{n - i})$ ?

Folklore

把序列拆成两个 $N / 2$ 长度的段, 左边算完了算左边对右边的贡献, 然后算右边. $T (N) = 2 T (N / 2) + O (N \log N)$ , 解得 $O (N \log^{2} N)$ .

能不能再给力一点啊?

把序列拆成 $b$ 个 $N / b$ 长度的段, 左边算完了算左边对右边的贡献, 然后算右边.

注意到每块可以直接做 DFT 和 IDFT, 对之后每块的贡献不需要分别算了, 因此时间是 $T (N) = b T (N / b) + O (N \log N + N b)$ , 取 $b = \log N$ , 解得 $O (\frac{N \log^{2} N}{\log \log N})$ .

能不能再给力一点啊?

注意到上面的 "块之间的贡献" 也是一个半在线卷积, 时间可以是 $T (N) = b T (N / b) + (2 N / b) T (b) + O (N \log N)$ . 注意这里的半在线卷积不是跑完一个跑另一个了, 而是它们一起跑.

取 $b = \sqrt{N}$ , 递归式是 $T (N) = 3 \sqrt{N} T (\sqrt{N}) + O (N \log N)$ , 复杂度 $T (N) = O (N (\log N)^{\log 3 / \log 2})$ .

能不能再给力一点啊? [vDH07]

我们的目标是什么? 答: 上面的递归式每次将 $N$ 变成了 $N^{1 / 2}$ 级别的规模, 我们希望比这个块还要小.

将 $N$ 理解成一个 $N^{1 / ℓ}$ 进制数, 或者说, $ℓ$ 层分块, 对于 $i$ 到 $j$ 的贡献, 我们在它们不同的那个最高位位置计算贡献. 这样一来, 有递归的时间复杂度

T (N) = (2 ℓ - 1) N^{1 - 1 / ℓ} T (N^{1 / ℓ}) + O (ℓ N \log N) .

注意, 现在 $N$ 每次变成 $N^{1 / ℓ}$ 了, 那么只需要经过 $\log \log N / \log ℓ$ 轮后, 就到了递归树的叶子. 我们把 $2 ℓ - 1$ 放成 $2 ℓ$ , 注意到下一层是

2 ℓ N^{1 - ℓ} \cdot ℓ N^{1 / ℓ} \log N^{1 / ℓ} = 2 ℓ N \log N,

容易归纳发现第 $k$ 层的代价是 $2^{k} ℓ N \log N$ , 所以递归的总代价是

T (N) = O (2^{\log \log N / \log ℓ} ℓ N \log N) .

由于

2^{\log \log N / \log ℓ} ℓ = 2^{\frac{\log \log N}{\log ℓ} + \log ℓ},

最优取到 $\log ℓ = \sqrt{\log \log N}$ , 有

T (N) = O (N \log N 2^{2 \sqrt{\log_{2} \log N}}) .

根据换底公式, 这也就是 [vDH07] 所写的

T (N) = O (N \log N \exp (2 \sqrt{\log 2 \cdot \log \log N})) .

[vDH07] Joris van der Hoeven, 2007. New algorithms for relaxed multiplication.

能不能再给力一点啊? (upd: 2023.8.12)

如果递归树的叶子数和你根位置的时间复杂度长得不一样, 说明还有平衡的可能.

我们试图将 Hoeven 的分治改成更平衡的形式, 取 $\log N = ℓ_{1} \dots ℓ_{k}$ , 时间复杂度是

T (N) \leq (ℓ_{1} + 2 ℓ_{2} + \dots + 2^{k - 1} ℓ_{k}) \cdot O (N \log N) .

如果 $ℓ_{1} = 2 ℓ_{2} = \dots = 2^{k - 1} ℓ_{k}$ , 如果 $ℓ_{k} = 2$ , 那么 $ℓ_{1} = 2^{k}$ , 且 $\log N = 2^{k (k + 1) / 2}$ . 只需取 $k = \sqrt{2 \log_{2} \log N}$ , 复杂度就是

k \cdot ℓ_{1} \cdot O (N \log N) = O (N \log N e^{\sqrt{2 \log 2 \cdot \log \log N}} \sqrt{\log \log N}) .

好像 Hoeven 在 2014 年的时候在 审稿人的提示 下发现这件事了, 散了散了...

posted @ 2023-04-13 23:33 EntropyIncreaser 阅读(2388) 评论(7) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 区间半群查询与 Ackermann 函数

· 一些经典问题比暴力快一点点的算法

· 闲话 23.1.6

· 多叉分治半在线卷积

· 2023.1.9 闲话

阅读排行：
· 手把手教你在本地部署DeepSeek R1，搭建web-ui ，建议收藏！
· Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
· 数据库服务器 SQL Server 版本升级公告
· 程序员常用高效实用工具推荐，办公效率提升利器！
· C#/.NET/.NET Core技术前沿周刊 | 第 23 期（2025年1.20-1.26）

公告

昵称： EntropyIncreaser
园龄： 4年4个月
粉丝： 371
关注： 9

+加关注

2025年1月

日

一

二

三

四

五

六

EntropyIncreaser

“征服世界的将是这样一些人：开始的时候，他们试图找到梦想中的乐园，最终，当他们无法找到时，就亲自创造了它。”

脑力体操: 半在线卷积能做到多好? (van der Hoeven, 2007)

Folklore

能不能再给力一点啊?

能不能再给力一点啊?

能不能再给力一点啊? [vDH07]

能不能再给力一点啊? (upd: 2023.8.12)

公告

搜索

常用链接

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论