非常不正经的鞅与停时定理理解

鞅与停时

计数题的小技巧，也许以后会更详细学一学，目前参考价值不高。

直接看题目。

例题：

一共有 $n \times m$ 张卡， $n$ 种，每种各 $m$ 个。手中维持有 $m$ 张，知道初始的时候每一种牌有 $a_{i}$ 个，每次随机一张扔掉，并且在牌堆中随机抽一张，然后把扔掉的牌插入牌堆。问多少次之后能够让手牌只有一种卡。

多次给定 $a$ 询问。

$n \leq 5000, q \leq 200, m \leq 10^{5}$ 。

考虑比较简单的做法，这种期望题不妨考虑解方程的形式，设 $f_{i}$ 表示 $i$ 状态还有几步结束，注意到一个事实，我们只关注 $i$ 的可重集，也就是说排序之后考虑，会发现 $n \leq 17$ 的时候状态数不到 $300$ 。有转移 $f_{u} = \sum p_{u \to v} (1 + f_{v})$ ，对着这个高斯消元即可。

对于 $n = 2$ 的时候，会发现可以通过前面一个状态推后面一个，这样可以做到快速计算。

更大一点就是正解了，这里需要引入一个科技

鞅与停时定理

非常非常粗浅的理解。

鞅

如果一个时间离散的随机过程 ${X_{0}, X_{1}, X_{2} \dots}$ 满足以下两个条件，则称之为鞅

$\forall t \in N, E (| X_{t} |) < \infty$ ，即 $E (| X_{t} |)$ 有限
$\forall t \in N, \forall X_{0}, X_{1} \dots, E (X_{t + 1} - X_{t} | X_{0}, X_{1} \dots X_{t}) = 0$

考虑用赌博的过来理解，可以把每一个 $X$ 视为赌博某个时刻拥有的资金，每一次变换相当于进行了一次赌博。那么第一个限制就是资金期望有限，第二个限制就是，不管之前状态如何新的一局期望收益始终为 $0$ 。

注意到第二个结论可以推到出 $\forall t \in N, E (X_{t}) = E (X_{0})$ 。

停时

随机过程可能有一个终止的时间，但是这个时间可能有多种可能，比如说在数轴上随机游走，走到某个点就停止，那么这个停止时间就是随机的。称这个随机变量为停时。

停时需要满足，通过 $0 - T$ 时刻的所有的信息可以判断 $T$ 时刻是否停下。

鞅与停时定理

考虑鞅的停时，设 $T$ 是鞅 ${X_{0}, X_{1}, X_{2} \dots}$ 的一个停时，以下三者之一成立的时候，有 $E (X_{T}) = E (X_{0})$ 。

$T$ 几乎一定有界
$\forall t \in N, | X_{t + 1} - X_{t} |$ 一致有界， $E (T)$ 有限
$\forall t \in N, X_{t}$ 一致有界， $T$ 几乎一定有限

其中有一些高级的词语，几乎一定的意思为 $P (x) = 1$ ，有限的意思为 $< \infty$ ，有界的意思为 $\exists l, r, l \leq x \leq r$ 。

我目前也不太会证明，一般题目要求的都是 $E (T)$ 因此可以认为题目中这个定理始终成立。

势能函数

OI 中的最常见的应用。

构造函数 $φ (X)$ 满足：

\forall t \in N, E (φ (X_{t + 1}) - φ (X_{t}) | X_{0}, X_{1} \dots X_{t}) = - 1

可以理解为一个刻画变化过程的函数。

这个时候就可以利用鞅与停时定理了，令 $Y_{i} = φ (X_{i}) + i$ ，不难发现 $Y$ 是一个鞅。直接用定义法证明即可。

那么就会有优秀的性质 $E (Y_{T}) = E (Y_{0})$

展开分析，利用期望的线性性。

\begin{aligned} E (Y_{T}) & = E (Y_{0}) \\ E (φ (X_{T}) + T) & = E (X_{0}) \\ E (T) & = E (X_{0}) - E (φ (X_{T})) \end{aligned}

注意到 $φ$ 是我们自己构造的，不妨令其为常数，那么最后得到的就是

E (T) = E (X_{0}) - φ (X_{T})

这就是最常见的应用了，用来计算停时的有用工具。

回到原题，之前提到，我们只关注现在每个种类个数的可重集，那么不妨令 $f (a)$ 表示一个时候的势能， $f (a) = \sum_{i = 1}^{n} φ (a_{i})$ 其中 $φ$ 就是一个构造的函数。

根据上面的过程，对于 $φ$ 进行限制，即 $E (f (i + 1) - f (i)) = - 1$ ，考虑变化的过程，如果选择 $i \to j$ 那么相当于 $f$ 不会改变，也就不会对于 $E$ 有贡献。那么只需要关心有共贡献的部分，假设目前每一个有 $a_{i}$ 个，令 $d (i) = φ (i) - φ (i - 1)$ 式子写出来就是：

\begin{aligned} - 1 & = \sum_{i \neq j} \frac{a_{i}}{m} \times \frac{m - a_{j}}{(n - 1) m} \times (φ (a_{i} - 1) - φ (a_{i}) + φ (a_{j} + 1) - φ (a_{j})) \\ = \sum_{i \neq j} \frac{a_{i}}{m} \times \frac{m - a_{j}}{(n - 1) m} \times (d (a_{j} + 1) - d (a_{i})) \\ = \sum_{i \neq j} \frac{a_{i}}{m} \times \frac{m - a_{j}}{(n - 1) m} \times d (a_{j} + 1) - \sum_{i \neq j} \frac{a_{i}}{m} \times \frac{m - a_{j}}{(n - 1) m} \times d (a_{i}) \\ = \sum_{j = 1}^{n} \frac{m - a_{j}}{m} \times \frac{m - a_{j}}{(n - 1) m} \times d (a_{j} + 1) - \sum_{i = 1}^{n} \frac{a_{i}}{m} \times \frac{(n - 2) m + a_{i}}{(n - 1) m} \times d (a_{i}) \end{aligned}

推完式子别忘了， $d$ 是我们自己构造的，那么不妨设：

\frac{m - a_{i}}{m} \times \frac{m - a_{i}}{(n - 1) m} \times d (a_{i} + 1) - \frac{a_{i}}{m} \times \frac{(n - 2) m + a_{i}}{(n - 1) m} \times d (a_{i}) = - \frac{1}{n}

这样可以线性构造出来 $d$ ，也就线性得到了 $φ$ 。

最后根据鞅与停时定理，得到答案就是 $a n s = f (a) - φ (m)$ 。

posted @ 2024-03-21 21:16 Jryno1 阅读(38) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 数论函数浅谈

· 多项式计数

· [做题笔记] 鞅的停时定理

· 鞅与停时定理

阅读排行：
· 无需6万激活码！GitHub神秘组织3小时极速复刻Manus，手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火，是硬核还是营销？
· 一文读懂知识蒸馏
· 终于写完轮子一部分：tcp代理了，记录一下

公告

昵称： Jryno1
园龄： 2年6个月
粉丝： 3
关注： 3

+加关注

2025年3月

日

一

二

三

四

五

六

Loading

Jryno1's blog

非常不正经的鞅与停时定理理解

鞅与停时

例题：

鞅与停时定理

鞅

停时

鞅与停时定理

势能函数

公告

搜索

常用链接

最新随笔

随笔分类

随笔档案

阅读排行榜