设计笃㲼

\[\newcommand{\b}{\boldsymbol} \newcommand{\vare}{\varepsilon} \]

Stable Matching

Formulation:双方各自拥有喜爱顺序 list。

结论:必然存在稳定匹配。

算法:

  • 左方一个点的增广流程为:按照喜好不断寻找下一个人,尝试提交申请,如果申请通过则终止增广。
  • 右方一个点的审核流程为:检查申请人是否优于当前选择,如果否则驳回,是则通过,并通知原选定者开始增广。

因为如果左侧有人未匹配,则右侧必然有人未匹配,所以算法必然会结束于完美匹配。右方点的匹配结果只会越来越好,所以左侧点一旦被某个右侧点拒绝,则之后也不会再被选择。因此,左侧点匹配者之前的所有人都拒绝过它;右侧点匹配者之前的所有人都没有向它提出过申请(它们已经与在自身偏好中更前者匹配)

特别地,如果左侧所有点的偏好都随机,则期望 \(\dfrac in\) 次即可查询到空点,因此复杂度平方。

Dijkstra & Prim

最优性证明方法:时刻保证当前解可以扩充为某一最优解。

Kosaraju & Tarjan

Kosaraju:对原图 dfs,求出 完成 时间戳;按照时间戳逆序,对逆图(所有边反向的图)中所有点搜索,可到达的点构成强连通分量。

证明:原图和逆图具有相同 SCC 划分。缩点后,原图中的完成时间是倒置的拓扑序,因此逆图中每次搜索就相当于正着从拓扑序中剥除点。

Tarjan:如果新点未访问,则访问并用 low 更新;若已访问但未染色,则用 dfn 更新;如果访问结束后 dfn=low,则发现 SCC。

Tree Width

参见 宽体树图。Takeaways:

定义:一张图 \(G=(V,E)\) 的树分解是满足如下条件一棵树 \(T\)\(T\) 上每个节点 \(t\) 都放置了一个集合 \(V_t\),且:

  • \(V\) 中每个节点被至少一个 \(V_t\) 包含。
  • \(V\) 中每条边的两端点至少被一个 \(V_t\) 同时包含。
  • \(V\) 中每个节点被 \(V_t\) 包含的全体 \(t\) 构成连通块(换言之,如果 \(t_1,t_2\) 都包含 \(x\),那么二者路径中的每个 \(t\) 均包含 \(x\)

对于 \(T\) 上一个节点集合 \(T'\),定义 \(G_{T'}\)\(T'\) 中全体节点 \(V_t\) 的并集的导出子图。

树分解满足如下性质:

  • 对于树上每个节点 \(t\),删去 \(t\) 后树分成若干块 \(T_1,\dots\),则全体 \(G_{T_i}\setminus V_t\) 两两无交、且不相邻。
  • 对于每条边 \((s,t)\),删去后树分成两块 \(T_1,T_2\),则 \(G_{T_i}\setminus\{V_s\cap V_t\}\) 无交、不相邻。

第一条性质:假设有交,不妨令 \(T_1\) 中的点 \(t_1\)\(V_{t_1}\)\(T_2\)\(t_2\)\(V_{t_2}\) 同时含 \(x\notin V_t\),则 \(t\)\(t_1\)\(t_2\) 的路径上,因此必须包含 \(x\),则 \(x\in V_t\),不合法;假设有边 \(x,y\),则 \(x\)\(T\) 中的分布连通块显然不能过 \(t\)\(y\) 同理,于是它们不可能在同一个 \(V_t\) 内共存,\((x,y)\) 边未被任何 \(V_t\) 同时包含。

第二条性质同理。

一个树分解对应的树宽即为 \(\max|V_t|-1\)。一个图的树宽为全体树分解中最小树宽。子图的树宽必然不超过母图。

一个非冗余 (nonredundant) 的树分解是任意相邻两点 \(s,t\) 不存在一个的 \(V\) 包含另一个的场合。通过重复将被包含的那个点缩到更大的点上,一个冗余树分解必然可以在不改变树宽的前提下变成非冗余树分解。通过不断剥叶子,可以证明非冗余树分解的点数必然不超过原图的点数。


可以构建树宽的 \(4\)-近似 \(w\)-FPT 算法。首先,如何判定树宽?

定义:两个包含相等数目节点的集合 \(Y,Z\) 是可分 (separable) 的,若它们间的最小割点集的大小严格小于二者共同的节点数目。即,存在集合 \(X\) 满足 \(|X|<|Y|=|Z|\),且 \(Y\setminus S\)\(Z\setminus S\)\(G\setminus S\) 上不连通。【注意,这并不要求 \(Y,Z\) 无交】

定义:一个集合 \(X\) 被称作 \(w\)-连接 (\(w\)-linked) 的,如果 \(|x|\geq w\) 且其中所有子集 \(|Y|=|Z|\leq w\) 都是不可分的。

可以在 \(f(|X|)m\) 的复杂度内判定一个集合 \(X\) 是否是 \(w\)-连接的;如果不是,该算法同时可以找到可分集合对 \((Y,Z)\) 和它对应的割点集 \(S\)

方法很简单:全体 \(Y,Z\) 对共有不超过 \(4^{|k|}\) 对;每一对相当于求最小割,因此在 \(|Y|m\) 的复杂度内即可判定是否可分。

定理:存在大小至少为 \(3w\)\(w+1\)-连接集合意味着树宽至少为 \(w\)

假设存在非冗余的树分解 \(T\) 满足全体 \(|V_t|\leq w\),同时存在 \(w+1\)-连接、大小至少为 \(3w\) 的集合 \(X\)

令树是有根树。令 \(G_t\) 为树上节点 \(t\) 子树中全体点对应的 \(G_T\)。考虑从根往下能走就走,直到某点 \(t\),满足 \(G_t\) 包含超过 \(2w\)\(X\) 中元素,但其全体儿子均不然。

显然 \(t\) 不是叶子(否则 \(G_t=V_t\),而 \(|V_t|\leq w\))。令其有儿子们 \(t_1,\dots,t_d\)

假如存在一个包含至少 \(w\)\(X\) 中元素的儿子 \(t_i\),则从中挑出 \(w\) 个作为 \(Y\),从 \(G-G_{t_i}\) 中挑出 \(w\) 个作为 \(Z\)。因为非冗余,所以 \(|V_t\cap V_{t-1}|<w\),而删去 \(V_t\cap V_{t-1}\) 后,\(Y\)\(Z\) 就此分别,于是 \(Y,Z\) 可分,违背了 \(X\)\(w+1\) 连接的前提。

假如不存在这样的儿子,那么考虑用多个儿子组合起来,直到 \(G_{t_{1\sim p}}\) 中包含严格超过 \(w\)\(X\) 中元素,则其必然严格小于 \(2w\) 个。于是从其内部挑 \(w+1\) 个,再从外部挑 \(w+1\) 个,删光 \(V_t\) 即可将它们分割。

算法:给定一个阈值 \(w\),构造一个树宽小于 \(4w\) 的树分解或判定存在大小至少 \(3w\)\(w+1\)-连接集合。

维护一个部分树分解:我们如今已构造了若干 \(V_t\);它们应恰好成为 \(G\) 的某个子集(即全体 \(V_t\) 并集 \(U\))诱导子图的树分解。我们需要保证部分树分解中全体 \(|V_t|\leq4w\)

\(G\setminus U\) 由若干连通块组成,它们是相对独立的。一个连通块 \(C\) 拥有邻居 \(u\in U\),如果 \(u\)\(C\) 中某一元素 \(v\) 相邻。

在维护部分树分解的过程中,同时维持一条额外性质,即任意时刻,每个 \(C\) 至多有 \(3w\) 个邻居,这些邻居由同一个 \(V_t\) 储存(即 \(C\) 中诞生的新状态的父亲)。这样,每次递归就是从 \(C\) 中挑出不超过 \(w\) 个元素,把它与这不超过 \(3w\) 个邻居放一块搞出来,作为 \(V_t\) 的儿子连出来。

如果邻居确实不够 \(3w\) 个,那再多一个也没事。于是从 \(C\) 中随便挑一个,把它和这不足 \(3w\) 个邻居放一块诞生子状态,则 \(C\) 分裂(不一定发生)出的所有子状态的邻居集合至多多一个新增元素,因此这样做合法。

现在邻居恰有 \(3w\) 个,记为集合 \(X\)。首先可以跑一边 \(w+1\)-连接集合验证算法,判定邻居集合是否是 \(w+1\)-连接的,如果是那么 \(G\) 的树宽显然大于 \(w\)。否则其并非 \(w+1\) 连接的,存在两个集合 \(Y,Z\),通过删去某个 \(S\) 而不连通。

因为 \(Y,Z\) 各自都与 \(C\) 中有边,所以 \(S\) 不可能不含 \(C\) 中元素。取 \(S'=S\cap(Y\cup Z\cup C)\),则 \(S'\not\subseteq X\)\(|S'|\leq w\)。令 \(S'\cup X\)\(V_s\) 作为 \(V_t\) 的儿子,则其合法,因为:

\(S''\)\(S'\) 中剔除 \(X\) 中元素的部分。则 \(C\setminus S''\) 中的每个元素关于与 \(Y,Z\) 是否联通,分成两个集合,每个集合的邻居集合都是 \(X\) 中用 \(Y/Z\) 二者其一换成了 \(S\),因此邻居数量仍然保持在 \(3w\) 内。

Graph Minor

Graph Minor(图子式)是通过删点、删边、缩边得到的结构。

Kuratowski-Wagner 定理:平面图是不存在 \(K_5,K_{3,3}\) 子式的图。

Robertson-Seymour 图子式定理:在任意无限图集合中,至少一张图是另一张图的真子式。

Minor-Closed Family(这玩意的译名真不知道是啥,浅编了一个 子式闭族 出来)是子式属于集族的集族。一个集族是子式闭族,当且仅当它有有限个极小禁止图子式(即,一个图属于该集族,当且仅当它不含任何禁止图子式)。因此,一切子式闭族都存在类似 K-W 定理的等价式。

一些子结论:固定一张图,可以 \(O(n^3)\) 判定该图是否是另一张图的子式;存在 \(f:\mathbb{N\to N}\) 满足一切有着至少 \(f(r)\) 树宽的图都有着 \(r\times r\) 的子式。

NPC Problems

注意:在验证一个问题是 NPC 之前,先要确认它确实是 NP!!!

所有能被使用的 NPC 问题:

独立集;Set Packing(从 \(m\) 个集合中选取最多数目的不交集合);点覆盖;集合覆盖;3D matching(三元组覆盖三分图);三及以上染色;Hamilton 环和路径;TSP;subset sum(判定是否有和为某元素的子集);3-SAT。

独立集的补集是点覆盖。点覆盖容易归约到集合覆盖(点覆盖了邻域中所有边),同理独立集容易规约到 set packing。

3SAT 规约到独立集:每个 clause 的三个变量建三个点互相连边,同一个变量的正负取值之间互相连边,这样合法当且仅当最大独立集包含每个 clause 中的恰一个元素。

3SAT 到 Hamilton 环:对每个变量建一条足够长的路径,左向为真右向为假。自源点向第一条路径的起讫点各连边,第一条路径起讫点向第二条……最后一条起讫点连向汇点,汇点再连回源点。现在如果我们想要强制一条路径的方向,就新建一个点,其自三条路径三个点连来,再连到它们各自下一个点即可。【Hamilton 环是针对有向图定义】。Hamilton 环到 TSP 是容易的。有向 Hamilton 怎么到无向 Hamilton?答曰:拆点,一个点拆成三个点,这样让路径必须从入点走向出点。

无向/有向 Hamilton 环到无向/有向 Hamilton 路径:枚举每条边,把它干掉然后检查有没有 Hamilton 路径即可。

3SAT 到 3DM:对每个变量造一堆 chip,强制选中所有奇数位或偶数位之一的所有 chip。clause 可以造两个新点然后强制需要 chip 中的某个点。剩下还有一批点没有被 cover,造一堆两个点的 cleanup 元素连到所有点即可。

3SAT 到 3color:造出 base,true,false 三个基元点连成三元环,对于所有变量造出其自身和其否定,与 base 连成三元环。如果自身与 true 同色则认为其是 true,与 false 同色则相反。clause 要求三个位置至少有一个与 true 同色,于是用 3color 造一个三个 false 的输入无法染色的图电路即可。方法:

(x_1,1),(T,1),(T,2),(1,2),(T,3),(3,x_2),(T,4),(x_3,4),(4,5),(F,5),(1,6),(3,6),(5,6)

3DM 到 Subset Sum:每个 3 pair 对应三个 bit,要求不能出现进位。

FPT

Fixed Parameter Tractable,复杂度是 \(f(k)\text{poly}(n)\)。注意,\(n^k\) 并非 FPT。

VC 关于 VC 大小的 FPT:注意到对于任意一条边 \(e=(u,v)\)\(G\) 存在 \(k\) 的 VC,当且仅当 \(G\setminus\{u\}\) 存在 \(k-1\) 的 VC,或是 \(G\setminus\{v\}\) 存在 \(k-1\) 的 VC。于是,递归地尝试处理 \((G,k)\)

  • 倘若 \(G\) 没有边,直接结束。
  • 因为每个 VC 中的点至多处理掉 \(|V|\) 条边,因此如果 \(|E|>k|V|\),则必然找不到 \(k\)-VC。
  • 找一条边,检查 \((G\setminus\{u\},k-1)\)\((G\setminus\{v\},k-1)\)

共检查 \(2^k\) 个实例,每个实例的级别是 \(kn\) 的,于是复杂度为 \(2^kkn\)

Co-NP

NP 问题需要存在某个证据并判定存在解,在不存在解时对一切证据均输出不存在解;Co-NP 则相反,存在证据判定不存在解,存在解时何种证据都无法判定不存在解。

Approximation Algorithm

一个算法是 \(k\)-approximation 的,如果对于一切输入,算法结果 \(a\) 与真实结果 \(b\) 满足 \(\dfrac ab\) 的上界是 \(k\)(如果 \(a>b\))或者 \(\dfrac ba\) 的上界是 \(k\)(如果 \(b>a\))。

Load Balacing Problem:\(n\) 个任务分配到 \(m\) 台机器。

  • 把任务分配给当前任务量最少的机器。因为 \(T^*\geq\dfrac1m\sum t_i\)\(T^*\geq\max t_i\),而在最后一个任务被分配前,任务量最少的机器必然不超过 \(\dfrac1m\sum t_i\),且最后一个任务必然不超过 \(\max t_i\),所以知此方案必然不超过 \(2T^*\)
  • 按照时间递减顺序分配。若 \(n>m\),则 \(T^*\geq t_{n-1}+t_n\),于是 \(t_n\leq\dfrac12T^*\),于是知此方案是 \(1.5\)-近似。

\(K\)-Center: 最小化到大小为 \(K\) 集合的最远点距离。

  • 枚举 \(k\),然后每次随意选一个点、删掉该点的 \(k\)-邻域。若最优策略是 \(r\),则当枚举至 \(2r\) 时,每个最优集合点的 \(r\)-邻域中至少会有一个点被选中,而这个点的 \(2r\)-邻域能覆盖 \(r\)-邻域中所有点,因此此乃 \(2\)-近似。这个近似已经达到上界,因为小于 \(2\) 的近似不弱于判定支配集。

Weighted Set Cover:集合带权版本的集合覆盖。最小化选择集合的权值和。

  • 选择 \(\dfrac{w_i}{\#\text{新增元素}}\) 最小的集合加入。定义 \(c_x\) 为一个点初次被 cover 时,其对应的 \(\dfrac{w_i}{\#\text{新增元素}}\),则有 \(\sum w_i=\sum c_x\)。而对于每个 \(S_i\),有 \(\sum_{x\in S_i}c_x\leq H(|S_i|)w_i\):因为 \(S_i\) 中的每个元素被删去时,此时的 \(c_x\) 必然不超过 \(w_i/\# S_i\text{ 中仍剩余元素}\),因此结果是调和级数。

然后知这是 \(O(H_n)=O(\log n)\)-近似。这个近似已经达到上界。

背包:对于 \(\vare\),取 \(b=\vare/2n\),令离散权值 \(\bar v_i=\left\lceil v_i/b\right\rceil b\),则本质只有 \(2n/\vare\) 种不同权值。然后可以 DP 达到某个权值所需的最少空间,复杂度 \(O(n^3/\vare)\),然后是 \(1+\vare\) 的近似。此乃 FPTAS (Fully Poly-Time Approximation Scheme)。

Linear Programming

问题:限制 \(A\b x\geq\b b\)\(\b x\geq\b0\),最大化 \(\b c\cdot\b x\)。变种如 \(\leq\) 可以取负号,\(=\) 可以变成一个 \(\geq\) 一个 \(\leq\),最小化可以取反 \(\b c\)

本质上是计算凸超多面体在超平面上投影的最远位置。因为凸性,所以只需要考虑多面体的顶点信息即可。

VC 容易转成整数线性规划(ILP)。LP 的最优解显然至少与 ILP 等优。而可以通过令 \(x_\text{ILP}=[x_\text{LP}\geq0.5]\) 来把 LP 解变成 ILP 解,在 VC 问题上这是一个 \(2\)-近似。

集合覆盖 SC 也容易转成 ILP。以 \(x_\text{LP}\) 的概率设置 \(x_\text{ILP}\) 的解,则转化得到的 ILP 解的期望等于 LP 解;但是它不一定是合法解。对于一个元素,其未被 cover 的概率是 \(\prod(1-x_i)\),且满足 \(\sum x_i\geq1\)。这个概率的上界是 \(1/e\)。因此,重复 \(T=2\ln n\) 次 LP 并对采样结果求并,则一个元素未被任何一次 cover 的概率不超过 \(e^{-T}=1/n^2\),所有元素中有一个未被 cover 的概率由 Union Bound 不超过 \(1/n\),因此合法概率是 \(1-1/n\),而这个解是一个 \(2\ln n\) 近似解。

Divide & Conquer

主定理:如果

\[T(n)=\begin{cases}\Theta(1)&(n\leq n_0)\\aT(n/b)+f(n)&(n>n_0)\end{cases} \]

此时 threshold \(\bar c=\log_b a\)。如果 \(f(n)=O(n^c)\) 其中 \(c<\bar c\),则 \(T(n)=n^\bar c\);如果 \(f(n)=\Theta(n^\bar c\log^k n)\),则 \(T(n)=n^{\bar c}\log^{k+1}n\);如果 \(f(n)=\Omega(n^c)\) 其中 \(c>\bar c\),则 \(T(n)=f(n)\)

\(n\log n\) 最近点对:在一半处切割,左右分别递归,然后关于左右最近距离 \(\delta\),以 \(\delta/2\times\delta/2\) 的方式划分格子,则每个格子中至多有一个点,于是对于所有距中轴距离不超过 \(\delta\) 的点,枚举与其 \(y\) 坐标最邻近的常数个点即可。

\(k\)-th element:思想还是分治,每次找到一个接近中位数的东西然后依照它将序列分成两部分然后进入对应部分。首先将序列分成 \(n/5\) 段长为 \(5\) 的段落,然后每段内部手动 \(5^2\) 排序找出中位数,然后对所有中位数构成数列调用 \(k\)-th element 求出中位数,再用这个中位数作为基准处理。则求出的中位数比 \(n/10\) 段中前三个元素大,比 \(n/10\) 段中后三个元素小,则调用后数列长度至多为原本的 \(70\%\)。有 \(T(n)\leq cn+T(n/5)+T(7n/10)\),而注意到 \(1/5+7/10<1\)

Network Flow

FF:每次随意挑一条路径,增广。整数域 FF 能正确停止,非整数域 FF 可能无法终结。EK 挑选最短路增广,是 \(|E|^2|V|\) 的。预流推进是 \(|V|^3\) 的。

Randomized Algorithm

随机抄一些 inequalities 罢。

Markov:对于 非负\(x\)\(\Pr(x\geq c)\leq\dfrac{E(x)}c\)。其也可以被应用于变式:对于 \(r\)\(\Pr(x\geq c)\leq\dfrac{E(x^r)}{c^r}\)

Chebyshev:\(\Pr(|X-E(X)|>c\sigma(X))<\dfrac1{c^2}\)。证明对 \((X-E)^2\) 用 Mar。

Cheroff: \(\Pr(X\geq(1+\delta)\mu)\leq\left(\dfrac{e^\delta}{(1+\delta)^{1+\delta}}\right)^\mu\)\(\Pr(X\leq(1-\delta)\mu)\leq\left(\dfrac{e^{-\delta}}{(1-\delta)^{1-\delta}}\right)^\mu\)。同时有推论:\(\Pr(X\geq(1+\delta)\mu)\leq e^{-(1/3)\delta^2\mu}\)\(\Pr(X\leq(1-\delta)\mu)\leq e^{-(1/2)\delta^2\mu}\)\(X\) 是若干次掷硬币(Bernoulli)组成。

Hoeffding 对于 \(X_i\in(a,b)\),有 \(\Pr(|\sum X_i-E(X_i)|\geq t)\leq2\exp(\dfrac{-2t^2}{n(b-a)^2})\)。在其不同分布时,也有 \(\Pr(|\sum X_i-E(X_i)|\geq t)\leq2\exp(\dfrac{-2t^2}{\sum(b_i-a_i)^2})\)。事实上,如果把内层的绝对值撤掉,那么右侧外部的 \(2\) 亦可撤掉。

大数定律:如果 \(x_i\) 均是 \(X\) 的取样,则 \(\Pr\left(|\dfrac1n\sum x-E(X)|\geq\vare\right)\leq\dfrac{V(X)}{n\vare^2}\),本质也是 Cheby。

Median Trick:使用采样估测期望时,选取所有采样的中位数作为期望的估值。

Hashing

为处理碰撞后的结果,可以使用拉链法或 open address method,即使用一系列 \(h(x,0/1/2/\dots)\) 并依次检查。好的 \(h\) 包括:\(h(x,i)=(h'(x)+c_1i+c_2i^2)\bmod p\)\(h(x,i)=(h_1(x)+ih_2(x))\bmod p\)

Universal Hashing Function:如果要构建 \(U\to\{0,\dots,p-1\}\) 的 Hash,我们希望有 \(\Pr(h(u)=h(v))\leq1/p\)。构建 \(h\) 的方法是:将 \(x\) 写成 \(p\) 进制的结果 \(\sum_{i=0}^{r-1}x_ip^i\),取一组 \(\vec a=(a_0,\dots,a_{r-1})\),然后令 \(h_{\vec a}(x)=(\sum_{i=0}^{r-1}x_ia_i)\bmod p\)。则对 \(x_i\neq y_i\) 的某一位 \(i\) 分析 \(a_i\) 的取值即可。

Perfect Hashing:\(O(n)\) 预处理,\(O(1)\) 检查键值是否存在。缺点是无法动态更新 hashtable。方法是首先搭一个 \(O(n)\) 的 hashtable,然后对于表中每个位置,令其中躺了 \(B_i\) 个元素,则造一个大小 \(B_i^2\) 的 hashtable 造二级 hash 结构,重复重构二级结构直到它不再碰撞。其空间大小为 \(\sum_{i,j}\Pr(h(i)=h(j))=O(n)\)。而如果 \(n\) 个元素映到 \(m\) 的表中,期望出现 \(\approx n^2/2m\) 次碰撞,于是由 Markov 有 \(\Pr(x\geq1)\leq E\),则当 \(m=5n^2\) 时,失败的概率不超过 \(1/10\)

Cuckoo Hashing:维护两个 hash table \(T_1,T_2\) 分别有 function \(h_1,h_2\)。如果 \(T_1(h_1(x))\) 为空,则插入;否则如果其中已经有 \(x'\),则用 \(x\)\(x'\) 挤掉,然后尝试在 \(T_2(h_2(x'))\) 插入 \(x'\)。假如某一轮插入次数超过阈值,则重构整个 hashtable。

使用 Hashing 做到期望线性的最近点对:随机重排,关于当前的 \(\delta/2\) 建构网格,则一个网格中至多出现一个点。一个点只需检查周边一圈的网格即可。

Random Analysis

Balls-Bins:\(n\) 个球扔进 \(n\) 个洞,最大值期望是 \(\dfrac{\log n}{\log\log n}\);期望空洞数是 \(n(1-1/n)^n\approx n/e\)。若球数 \(m=cn\log n\),则所有 load 都期望为 \(c(1\pm\vare)\log n\) 范围。期望 \(\sqrt n\) 次出现 collision。

Streaming Algorithm

输入以 stream 的形式给出,对空间有很强的限制。

统计不同元素数目?hash 后数末尾零的最多数目,期望有二的该数目次幂个不同元素。

BJKST:优化的不同元素数目计数。维护阈值 \(Z\) 和零数目超过该阈值的全体元素集合 \(B\)(记得去重)。当新来元素时,如果它超过阈值,则加入 \(B\);但是如果 \(|B|\) 超过了设置的桶大小(\(c/\vare^2\)),则不断抬高阈值并自 \(B\) 中删除不再逾越阈值的元素。最后用 \(2^Z|B|\) 来估计。

  • 不过课上讲的好像是,模大质数 \(M\) 后,记录前 \(K\) 小值,然后用 \(\dfrac{k(M+1)}{z_k}\) 估算。

Markov Chain

两个 distribution 的 Total Variation Distance

\[d_{TV}(\mu,\nu)=\max_{A\sube\Omega}|\mu(A)-\nu(A)| \]

易知 \(d_{TV}(\mu,\nu)=\dfrac12\sum|\mu(x)-\nu(x)|\)

另一种结果为,考虑 \(J\) 为一切 \(\mu,\nu\) 的 joint distribution(在 \(\Omega\) 有限的时候,\(J\) 可以记作一个矩阵,矩阵的行和与列和由 \(\mu,\nu\) 确定),则

\[d_{TV}(\mu,\nu)=\min_J(\Pr\limits_{(x,y)\sim J}[x\neq y]) \]

这种分析被用在 Coupling 的场合。

\(P^t(X,\cdot)\) 为自初态 \(X\)\(t\) 步的 distribution,即 \(XP^T\)。令 \(P^t(x,\cdot)\) 为自 \(x\) 单点出发的 distribution。定义 \(d(t)=\max\limits_{x\in\Omega}|P^t(x,\cdot)-\pi|_{TV}\)\(\epsilon\)-mixing time 为 满足 \(d(t)<\epsilon\) 的最小 \(t\)。而,另一种定义的 \(t_{avg}\) 则是对于一切初态 \(\bf x(0)\)(注意,这里的初态不一定是单点分布),要求 \(|\bf a(t)-\pi|_{TV}<\epsilon\)\(t_{avg}\)\(t_{mix}\) 在 aperiodic 的场合类似:此时必有 \(t_{mix}<t_{avg}\)

有一个性质是,不同的 \(t_{mix}(\epsilon)\) 之间,满足给定一个 \(t_{mix}(\epsilon_0)\) 则可以用于 bound 所有的 \(t_{mix}(\epsilon)\)。这是因为,定义 \(\bar d(t)=\max\limits_{x,y\in\Omega}|P^t(x,\cdot)-P^t(y,\cdot)|\),则易知 \(d(t)\leq\bar d(t)\leq2d(t)\),且 \(\bar d(t)\) 满足 \(\bar d(s+t)\leq\bar d(s)\bar d(t)\) 的好性质,因为

\[P^{s+t}(x,z)=\mathop E\limits_{X_s}(P^t(X_s,z))&(X_s\sim P^s(x,\cdot)) \\|P^{s+t}(x,\cdot)-P^{s+t}(y,\cdot)|_{TV} \\=\mathop E\limits_{X_s}|P^t(X_s,\cdot)-P^t(Y_s,\cdot)|_{TV} \\\leq\Pr(X_s\neq Y_s)\bar d(t) \\\leq\bar d(s)\bar d(t) \]

这是 mixing time 最朴素的定义。

\(t_{mix}(\epsilon)=O(\dfrac{\ln(1/\epsilon\pi^*)}\delta)\),其中 \(\pi^*\) 是 sta-dis \(\pi\) 中的最小值,\(\delta\) 是 eigengap。

定义 normalized conductance \(\Phi(S)=\dfrac{\sum\limits_{x\in S,y\in\bar S}\pi(x)P_{x,y}}{\min(\pi(S),\pi(\bar S))}\)\(\Phi=\min\Phi(S)\)。有 \(t_{avg}(\epsilon)=O(\dfrac{\ln(1/\pi^*)}{\Phi^2\epsilon^3})\)。conductance 分析仅适用于无向图的场合:而前述的谱分解分析适用于一切场合。

Cheeger 不等式连结了 \(\Phi\)\(\delta\):它指出 \(\dfrac\delta2\leq\Phi\leq\sqrt{2\delta}\)。但是,注意此处的 \(\delta=\lambda_1-\lambda_2\),与谱分解中的 \(\delta\) 不完全相同。当 \(P\) 正定时,两个 \(\delta\) 相等;而强制令游走时以一半概率留在原地后,得到的新 MC 与原 MC 有着相同的 sta-dis,且由 Gerschgorin’s Theorem,新 MC 必然正定。

Gaming Theory

Nash Equilibrium:没人能单方面改变策略使得自身变好。

Social Optimal:所有人的和达到最大。

Shapley Network Design Game:\(k\) 对点 \((s_i,t_i)\) 互相连接,若边被多次覆盖则只计算一次代价(所有参与者均分代价)。此时 Social Optimal 是 Steiner 树。

如何计算 Nash Equilibrium?定义一个局面的熵 \(\Phi=\sum_ec_eH(x_e)\),其中 \(c_e\) 是边权、\(x_e\) 是边被覆盖的次数。如果某个参与者更新了它的决策,这必然会降低熵,而因为总方案数有限,其最终会停在一个熵最低的态,这是一种 NE 的解。因此从 social optimal 出发不断迭代即可。

Price of Anarchy (PoA):\(\text{PoA}=\dfrac{\text{Cost(worst NE)}}{\text{Cost(SO)}}\)

Price of Stability (PoS):\(\text{PoA}=\dfrac{\text{Cost(best NE)}}{\text{Cost(SO)}}\)

PoS 是 \(\log k\) 级别。这是因为自 SM 出发 \(H(k)\text{Cost(SO)}\geq\Phi(\text{SO})\geq\Phi(\text{NE})\geq\text{Cost(NE)}\)

有向图时有 Worst Case Example:令 \(V=s\cup T\cup\{t_1,\dots,t_k\}\),点对 \(p_i=(s\to t_i)\),连边 \((s,t_i,1/i)\)\((s,T,1+\vare)\)\((T,t_i,0)\)。无向图时该 example 不成立。

Unrelated Machine Scheduling

Machine Scheduling 中,任务完成的时间可能与 machine 特异性相关。如果有 \(n\) 个机器 \(m\) 个任务,则每个任务分配给每台机器都需要建立一个变量。因此,限制总共只有 \(n+m\) 个,但是变量数目是 \(nm\) 的。直接 rounding 是 \(m\)-近似。但是注意到共 \(n+m\) 个限制导致每个顶点处都是只有 \(n+m\) 个方程,这意味着会有至多 \(n+m\) 个非零变量。因此外层套上二分,使用线性规划先解得解后,再对于所有非零变量构成的基环树森林使用 DP 手法处理,即可达到 \(2\)-近似。

  • 具体而言,一棵树的场合,叶子只能是任务。因此叶子必然分配给父亲,非叶子的任务丢给儿子,这样一台机器就收到了它原本的任务(儿子们)和至多一个额外任务(父亲),因此是 \(2\)-近似。

TUM

ILP 在对于一切整向量 \(\b b\),都有 \(A\b x\leq\b b\) 所限定的高维体积的所有顶点均为整点时,其解即等于 LP。

Totally unimodular matrix 定义为所有方形子矩阵(删除一些行列得到的矩阵)都有行列式为 \(\{0,\pm1\}\) 的矩阵。这样,可逆的子方阵就会是整方阵。

H-K 定理:矩阵是 TUM,当且仅当所有 \(b\) 的高维体积的所有顶点均为整点。于是,只要我们能判定一个矩阵是 TUM,则其对应的整数线性规划必然是可以被当成常规线性规划。

G-H 定理:一个 \(m\times n\) 矩阵是 TUM,当且仅当对于一切子集 \(R\sube[m]\),都存在将 \(R\) 划分为不交子集 \(R_1,R_2\) 的一种方式,使得对于一切 \(j\in[n]\),都有 \(\sum_{i\in R_1}a_{ij}-\sum_{i\in R_2}a_{ij}\in\{0,\pm1\}\)

  • 二分图匹配矩阵满足 G-H 定理。所有行都是连续 \(1\) 的矩阵同理。无重边网络流也是。

Ex

  • 假设我们有一个可以在所有解中均匀独立随机 sample 一个的算法,如何得到对解数目的 FPRAS?假如我们可以证明,首个 bit\(0\)(或是 \(1\))的解数目不会比全体解数目低太多(例如,二者的比值被常数 bound),就可以通过随机采样推测出首位是 \(0/1\) 的占比,然后递归地进行下去,直到算法的规模充分小。
  • 假设我们有 FPRAS,如何 sample?计算 \(S_1/S\) 后以该概率 sample 第一位,然后递归。
posted @ 2024-12-27 21:22  Troverld  阅读(30)  评论(0编辑  收藏  举报