Fine-Grained学习笔记(2):矩阵乘法与图论

问题:矩阵乘法

方阵乘法:

给定两个 $n \times n$ 的矩阵 $A = (a_{i j}), B = (b_{i j})$ ,计算 $C = A B, c_{i j} = Σ_{k = 1}^{n} a_{i k} b_{k j}$ .

(由于语言习惯,本文中提到矩阵且无其他说明的场合,均指方阵)

朴素算法的复杂度: $O (n^{3})$

设想中的复杂度下界: $Ω (n^{2})$ (把 $n \times n$ 的矩阵读取完就需要 $O (n^{2})$ 时间了)

Strassen算法(1969):

热身:考虑 $n = 2$ 的情况:

$c_{11} = a_{11} b_{11} + a_{12} b_{21}$

$c_{12} = a_{11} b_{12} + a_{12} b_{22}$

$c_{21} = a_{21} b_{11} + a_{22} b_{21}$

$c_{22} = a_{21} b_{12} + a_{22} b_{22}$

共需 $8$ 次乘法

思路:

考虑

$p_{1} = a_{11} (b_{11} - b_{21})$

$p_{2} = (a_{11} + a_{12}) b_{21}$

$p_{3} = a_{22} (b_{22} - b_{12})$

$p_{4} = (a_{21} + a_{22}) b_{12}$

$p_{5} = (a_{11} + a_{22}) (b_{21} + b_{12})$

$p_{6} = (a_{12} - a_{22}) (b_{21} + b_{22})$

$p_{7} = (a_{21} - a_{11}) (b_{11} + b_{12})$

$c_{11} = p_{1} + p_{2}$

$c_{12} = p_{5} + p_{6} + p_{3} - p_{2}$

$c_{21} = p_{5} + p_{7} + p_{1} - p_{4}$

$c_{22} = p_{3} + p_{4}$

总共只需要进行 $7$ 次乘法.

然后考虑任意 $n$ 的情况,将 $A, B$ 划分为四个子矩阵

$A = [\begin{matrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{matrix}]$

$B = [\begin{matrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{matrix}]$

并进行递归分治,分析时间复杂度

$T (n) = 7 T (n / 2) + O (n^{2})$

$T (n) = O (n^{\log_{2} 7}) \leq O (n^{2.81})$

其他的分治法思路

Laderman在1976年证明了 $3 \times 3$ 的矩阵乘法只需进行 $23$ 次乘法运算,然而对矩阵乘进行三路分治的复杂度 $T (n) = 23 T (n / 3) + O (n^{2}) = O (n^{\log_{2} 23}) \leq O (n^{2.85})$ ,反倒不如二路分治

Pan在1978年证明了 $k = 70$ 的矩阵乘法共需 $\frac{k^{3} - 4 k}{3} + 6 k^{2} = 143640$ 次乘法,因此对矩阵乘法进行 $70$ 路分治的复杂度 $T (n) = 143640 T (n / 70) + O (n^{2}) = O (n^{\log_{70} 143640}) \leq O (n^{2.796})$

Pan又在1978年证明了 $k = 46$ 的矩阵乘法共需 $41952$ 次,因此对矩阵乘法进行 $46$ 路分治的复杂度为 $T (n) = 41952 T (n / 46) + O (n^{2}) = O (n^{\log_{46} 41952}) \leq O (n^{2.781})$

Bini等人在1980年使用"Border Rank"理论使得矩阵乘法复杂度降低到了 $O (n^{2.780})$

Schonhage在1981年矩阵乘法复杂度降低到了 $O (n^{2.522})$

Strassen在1986年使用"Laser Method"将矩阵乘法复杂度降低到了 $O (n^{2.479})$

$⋮$

目前对矩阵乘法的复杂度下界尚没有一个定论,在本文中使用 $O (n^{ω})$ 表示矩阵乘法的复杂度,并认为 $ω = 2.372$ .

(长方形)矩阵乘法:

给定 $n_{1} \times n_{2}$ 的矩阵 $A = (a_{i j})$ , $n_{2} \times n_{3}$ 的矩阵 $B = (b_{i j})$ ,计算 $n_{1} \times n_{3}$ 的矩阵 $C = A B, c_{i j} = Σ_{k = 1}^{n} a_{i k} b_{k j}$ .

记 $M (n_{1}, n_{2}, n_{3})$ 为进行该运算所需的时间复杂度,记 $ω (a, b, c) = \log_{n} (M (n^{a}, n^{b}, n^{c}))$

以下结论是显然的:

1, $ω (\cdot, \cdot, \cdot)$ 是凸函数

$ω (t a_{1} + (1 - t) a_{2}, t b_{1} + (1 - t) b_{2}, t c_{1} + (1 - t) c_{2}) \leq t ω (a_{1}, b_{1}, c_{1}) + (1 - t) ω (a_{2}, b_{2}, c_{2}), \forall t \in [0, 1]$

2, $ω (\cdot, \cdot, \cdot)$ 是对称的

$ω (a, b, c) = ω (c, b, a) = \dots$

简单的下界性质:

考虑 $M (n, l, n)$ 形式的问题,根据 $l, n$ 之间的大小关系,将矩阵分为两种情况,根据矩阵乘法中左侧的矩阵的形状,将这两种情况称为"瘦矩阵"和"扁矩阵"

瘦矩阵乘:

按照如上方式,将两个矩阵分别拆分成 $n / l$ 个 $l \times l$ 的矩阵,总时间复杂度为 $O ((n / l)^{2} l^{ω}) = O (l^{ω - 2} n^{2})$

扁矩阵乘:

按照如上方式,将两个矩阵分别拆分成 $l / n$ 个 $n \times n$ 的矩阵,总时间复杂度为 $O ((l / n) l^{ω}) = O (l n^{ω - 1})$

但实际上,针对这两种分类还有更好的算法:

对于瘦矩阵乘:

Coppersmith在1982年给出了 $M (n, n^{0.172}, n) = \tilde{O} (n^{2})$ 的结论

LeGall和 $U r r u t i a$ 在2018年给出了 $M (n, n^{0.3189}, n) = O (n^{2 + ϵ})$ 的结论

对于扁矩阵乘:

当 $k > 1, M (n, n^{k}, n) = O (n^{k + 1 + f (k)})$ ,其中,当 $k \to \infty$ 时, $f (k) \to 0$

稀疏矩阵乘:

对于两个 $n \times n$ 的矩阵 $A, B$ ,其中的非零元素为 $m$ 个, $m ≪ n^{2}$

朴素算法:

复杂度为O(mn),由于 $m ≪ n^{ω - 1}$ ,因此优于 $O (n^{ω})$

博主注:这个 $O (m n)$ 的算法是怎么样的我没有想明白,感觉并不是那么朴素.

Yuster和Zwick的算法(2005):

思路:按照矩阵 $A$ 中每列非零元素个数多少,将所有列分为高频和低频两类讨论

记 $d e g (k) = | {i : a_{i k} \neq 0} |$

$H = {k : d e g (k) > Δ}$

$L = {k : d e g (k) \leq Δ}$

这样便保证了 $| H | \leq m / Δ$

低频列:

计算 $c_{i j}^{L} = Σ_{k \in L} a_{i k} b_{k j}$ ,具体的方法是:

$对于所有使得 b_{k j} \neq 0 的 k, j : (循环次数 O (m))$

$对于所有使得 a_{i k} \neq 0 的 i : (循环次数 O (Δ))$

$c_{i j} + = a_{i k} b_{k j}$

该情况时间复杂度 $O (m Δ)$

高频列:

将 $H$ 中所对应的矩阵 $A$ 中的列和矩阵 $B$ 中的行提取出来,构造出两个长方形矩阵: $n \times | H |$ 的矩阵 $A^{'}$ , $| H | \times n$ 的矩阵 $B^{'}$ ,计算 $A^{'} \cdot B^{'}$ ,得到 $c_{i j}^{H} = Σ_{k \in H} a_{i k} b_{k j}$ ,该情况时间复杂度 $M (n, m / Δ, n)$

总时间复杂度 $O (m Δ + M (n, m / Δ, n))$

应用:与矩阵和线性代数有关的问题

矩阵求逆, $A x = b$ 线性方程求解......

应用:有向图中寻找三元环

给定有向图 $G = (V, E)$

判断是否存在三个点 $u, x, v \in V$ ,使得 $(u, x), (x, v), (v, u) \in E$

朴素算法:

(1)暴力枚举三个点,时间复杂度: $O (| V |^{3})$

(2)枚举所有边 $(v, u)$ ,再枚举第三个点 $x$ ,判断 $(u, x), (x, v)$ 是否存在,时间复杂度: $O (| V | \cdot | E |)$ ,在 $| E | ≪ | V |^{2}$ 的稀疏图中较优

(3)利用矩阵乘法:

对于所有的 $u, v \in V$ ,计算 $c_{u, v} = \lor_{x \in V} ({(u, x) \in V} \land {(x, v \in V)})$ ,可由矩阵乘法计算.

然后对于所有 $u, v$ ,判断 $c_{u v} = 1 \land (v, u) \in E$

总时间复杂度 $O (| V |^{ω})$ ,相比算法(2)更适用于稠密图.

(4)利用稀疏矩阵乘法,复杂度 $O (| E | Δ + M (| V |, | E | / Δ, | V |))$

Alon,Yuster,Zwick的算法(1997):

思路还是分为高低频,根据点的度数划分(算法描述中使用的是点的出度)

$H = {v \in V : d e g (v) > Δ}$

$L = {v \in V : d e g (v) \leq Δ}$

情况1:

部分点在 $L$ 中的三角形,不妨记 $x \in L$

$对于所有使得 (u, x) \in E 的 u, x : (循环次数 O (| E |))$

$对于所有使得 (x, v) \in E 的 v : (循环次数 O (Δ))$

$判断是否有 (v, u) \in E$

该情况的时间复杂度: $O (| E | Δ)$

情况2:

三个点都在 $H$ 中的三角形

注意, $| H | \leq | E | / Δ$

运行朴素算法(3),该情况时间复杂度 $O ((| E | / Δ)^{ω})$

总时间复杂度: $O (| E | Δ + (| E | / Δ)^{ω})$

取 $Δ = | E |^{\frac{ω - 1}{ω + 1}}$ ,因为前文约定了 $ω = 2.372$ ,

得到 $O (| E |^{\frac{2 ω}{ω + 1}}) \leq O (| E |^{1.41})$

应用:有向图中寻找 $k$ 元环( $k$ 为常数)

Alon,Yusher,Zwick:Color coding,时间复杂度 $O (| V |^{ω})$ ,具体算法待查

对于稀疏图:

$k = 4 : O (| E |^{1.48})$

$⋮$

应用: $k$ -Clique( $k$ 团)

在无向图中寻找 $k$ 个两两相连的点构成的子图, $k$ 为常数

暴力枚举: $O (| V |^{k})$

若 $k \mod 3 = 0$ ,则可用 $O (| V |^{k / 3})$ 时间暴力枚举出图中的所有 $k / 3$ 团,将所有 $k / 3$ 团作为超级节点加入新点集 $V^{'}$ 中, $| V^{'} | = O (| V |^{k / 3})$ ,然后对于所有的 $A, B \in V^{'}$ ,若 $A$ 在 $G$ 中对应的点,均有指向 $B$ 在 $G$ 中对应的点,则将边 $(A, B)$ 加入新边集 $E^{'}$ 中,这样,问题就变为了在 $G^{'} = (V^{'}, E^{'})$ 上寻找三元环的问题,总时间复杂度 $O ((| V |^{k / 3})^{ω})$

应用:带权图

定义:(min,+)矩阵乘

$c_{u v} = min_{x \in V} (a_{u x} + a_{x v})$

类似于最短路算法中的"松弛"操作

下一章将会讨论这个算法

应用:传递闭包(全局连通性)

给定有向图 $G = (V, E)$ ,判断对于 $\forall s, t \in V$ ,是否存在从 $s$ 到 $t$ 的路径

朴素算法:

(1)进行 $| V |$ 次DFS/BFS: $O (| V | \cdot | E |) \leq O (n^{3})$

(2)Warshall DP(类似于Floyd):枚举中点 $x \in V$ ,再枚举两端点 $u, v \in V$ ,若边 $(u, x), (x, v)$ 均存在,则将边 $(u, v)$ 加入边集 $E$ 中,时间复杂度 $O (n^{3})$

Warshall算法使用重复矩阵乘的改进:

记 $c_{u v}^{(k)}$ 为真,当且仅当存在一条 $\leq k$ 跳的,从 $u$ 到 $v$ 的路径.

对于 $k = 1, 2, 4, \dots, | V |$ ,用矩阵乘法计算 $c_{u v}^{(k)} = \lor_{x \in V} (c_{u x}^{(k / 2)} \land c_{x v}^{(k / 2)})$

总时间复杂度: $O (| |^{ω} \log | V |) \leq O (| V |^{2.373})$

Munro算法(1971):

考虑 $G$ 是一个DAG(有向无环图)的情况,对于任意的图,可以通过搜索出所有强连通分量并合并为超级节点做到这一点.

搜索强连通分量并缩点的方法是Tarjan算法,一种DFS算法,在DFS的过程中将搜索到的顺序作为时间戳标记在每个节点上,并记录从该点回溯能够到达的时间戳最小的节点.在许多博客都有相应的讲解,这里不再赘述.

这样做的意义在于,DAG保证了邻接矩阵必定是一个上三角矩阵,记 $A = (a_{i j}), a_{u v}$ 为真,当且仅当 $u$ 到 $v$ 之间有一条边, $A^{*} = (a_{i j}^{*}), a_{u v}^{*}$ 为真,当且仅当 $u$ 到 $v$ 之间存在着连通的路径.

将 $A$ 写成如下分块矩阵的形式:

$A = [\begin{matrix} A_{11} & A_{12} \\ 0 & A_{22} \end{matrix}]$

那么

$A^{*} = [\begin{matrix} A_{11}^{*} & A_{11}^{*} A_{12} A_{22}^{*} \\ 0 & A_{22}^{*} \end{matrix}]$

由于 $A_{11}, A_{22}$ 也是上三角矩阵,因此可以递归求解,矩阵维数为 $1$ 时, $A_{11}^{*} = A_{11}, A_{22}^{*} = A_{22}$ ,因此总复杂度 $T (n) = 2 T (n / 2) + O (n^{ω})$ ,复杂度相比重复的矩阵乘减少了一个对数项.

posted @ 2023-04-25 23:13 Isakovsky 阅读(100) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Fine-Grained学习笔记(3):最短路(边权,点权),(min,+)矩阵乘

· Fine-Grained学习笔记(4):条件下界与归约,图论问题的复杂度归约理论

· 矩阵乘法与矩阵快速幂

· 一些经典问题比暴力快一点点的算法

· 单调情况的 (min, +) 乘法

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现

公告

昵称： Isakovsky
园龄： 5年7个月
粉丝： 12
关注： 1

+加关注

2025年3月

日

一

二

三

四

五

六

Isakovsky

AfACMer,北京理工大学,网络空间安全学院,PhD在读博客所有内容遵循CC0协议,但建议转载时附上原博客链接.

Fine-Grained学习笔记(2):矩阵乘法与图论

问题:矩阵乘法

方阵乘法:

Strassen算法(1969):

其他的分治法思路

(长方形)矩阵乘法:

简单的下界性质:

稀疏矩阵乘:

朴素算法:

Yuster和Zwick的算法(2005):

低频列:

高频列:

应用:与矩阵和线性代数有关的问题

应用:有向图中寻找三元环

朴素算法:

Alon,Yuster,Zwick的算法(1997):

情况1:

情况2:

应用:有向图中寻找 $k$ 元环( $k$ 为常数)

应用: $k$ -Clique( $k$ 团)

应用:带权图

应用:传递闭包(全局连通性)

朴素算法:

Warshall算法使用重复矩阵乘的改进:

Munro算法(1971):

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

Isakovsky

AfACMer,北京理工大学,网络空间安全学院,PhD在读 博客所有内容遵循CC0协议,但建议转载时附上原博客链接.

Fine-Grained学习笔记(2):矩阵乘法与图论

问题:矩阵乘法

方阵乘法:

Strassen算法(1969):

其他的分治法思路

(长方形)矩阵乘法:

简单的下界性质:

稀疏矩阵乘:

朴素算法:

Yuster和Zwick的算法(2005):

低频列:

高频列:

应用:与矩阵和线性代数有关的问题

应用:有向图中寻找三元环

朴素算法:

Alon,Yuster,Zwick的算法(1997):

情况1:

情况2:

应用:有向图中寻找k元环(k为常数)

应用:k-Clique(k团)

应用:带权图

应用:传递闭包(全局连通性)

朴素算法:

Warshall算法使用重复矩阵乘的改进:

Munro算法(1971):

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

AfACMer,北京理工大学,网络空间安全学院,PhD在读博客所有内容遵循CC0协议,但建议转载时附上原博客链接.

应用:有向图中寻找 $k$ 元环( $k$ 为常数)

应用: $k$ -Clique( $k$ 团)