最近遇到了很多带吸收璧的随机游动问题,且自己老是忘,又要回去翻书,索性直接写在这里方便自己翻阅。
例子引入
问题一
https://www.bilibili.com/video/BV1yV4y1k78J/?vd_source=67f30ac66578cfd789284b232e6fd4b8
位置6:24
把题干提炼一下:
\(
Q1:本金5000,胜率为p,败率为q\overset{\Delta}{=}1-p,,每次以1000进行赌局:(胜则为Bonus,输直接为0).求输光的概率 \\
\)
\(
这里先直接给出结果:\\
当取Bonus=2000(即胜则翻倍)时:
\)
\[P(输光的概率|此时手上5000)\overset{\Delta}{=}P_{lose}=
\cfrac{(\frac{p}{q})^5-(\frac{p}{q})^{n}}{1-(\frac{p}{q})^{n}}
=\cfrac{(\frac{1-q}{q})^5-(\frac{1-q}{q})^{n}}{1-(\frac{1-q}{q})^{n}}
\]
问题二
再者是Valorant(csgo,传统体育运动)的赛点加时
Q2:加时赛:\(|Score_A-Score_B|=2\)时结束该局对局:(实际上当两方实力相当时由于对称性当然易见\(P_{win}=P_{lose}=0.5\))
\(这里同样地先直接给出结果:\\\)
\[P(赢下对局的概率|此时战平)\overset{\Delta}{=}P_{win}=
\left\{
\begin{aligned}
\frac{(\frac{p}{q})^2-(\frac{p}{q})^{4}}{1-(\frac{p}{q})^{4}} && \text{if} && p\neq q\\
\frac{n}{a+b}=\frac{2}{2+2}=\frac12 && \text{if} && p=q
\end{aligned}
\right.
\]
\(如果当前状态不是平局状态,而是某一方领先1分(不妨设为我方),也能求出结果\)
\[P(赢下对局的概率|此时我方领先1分)\overset{\Delta}{=}P_{win}=
\left\{
\begin{aligned}
\frac{1-r^n}{1-r^{a+b}}=\frac{1-(\frac{p}{q})^3}{1-(\frac{p}{q})^{2+2}} && \text{if} && p\neq q\\
\frac{n}{a+b}=\frac{3}{2+2}=\frac34 && \text{if} && p=q
\end{aligned}
\right.
\]
一般情况
两个问题无非都可以看成一个点以不同的概率分别向左向右移动。比如说第一个问题就是在
\[\left\{
\begin{array}{l}
(0,+\infty)上随机游动(这里右吸收璧任取一个结束点即可)\\
起点为x=5\\
亏完点为x=0\\
以概率P_{lose}向左移动1格,以概率P_{win}向右移动1格\\
\end{array}
\right.
\]
第二个问题就是在
\[\left\{
\begin{array}{l}
[0,4]上随机游动\\
起点为x=2\\
对局结束点为x=0 \quad or \quad x=4\\
以概率P_{lose}向左移动1格,以概率P_{win}向右移动1格
\end{array}
\right.
\]
这种问题被称为带吸收璧的随机游动
把前面的符号颠覆。重新定义符号含义便于推导:
\[\begin{array}
{cl}
\hline
符号 & 说明 \\
\hline
p &状态点向左移动的概率 \\
q &状态点向右移动的概率(q=1-p) \\
q_0&P(被右壁吸收,初始位于x=0) \\
q_b&P(被右壁吸收,初始位于x=b) \\
q_n &P(被右壁吸收,初始位于x=n) \\
r &\overset{\Delta}{=}\cfrac{q}{p}(为了化简用 ) \\
c_n &\overset{\Delta}{=}q_{n+1}-q_n(为了化简用) \\
\hline
\end{array}
\]
\[\begin{array}{rcl}
q_n&=&pq_{n+1}+qq_{n-1}\\
(p+q)q_n&=&pq_{n+1}+qq_{n-1}\\
q(q_n-q_{n-1})&=&p(q_{n+1}-q_n)\\
qc_{n-1}&=&pc_n\\
c_{n}&=&\cfrac{q}{p}c_{n-1}\\
c_{n}&=&rc_{n-1}\\
以及边界条件q_{0}=0&,&q_b=1\\
\end{array}
\]
\[
\]
被右吸收璧吸收
\(p=q\)
\[\begin{array}{l}
\therefore q_n=q_0+\sum\limits^{n-1}_{i=0}(q_{i+1}-q_i)=q_0+nc\\
代入边界条件得c=\frac{1}{b}\\
因此q_n=\frac{n}{b}
\end{array}
\]
\(q\neq p\)
\[\begin{array}{l}
\therefore q_n=q_0+\sum\limits^{n-1}_{i=0}(q_{i+1}-q_i)=q_0+\sum\limits^{n-1}_{i=0}c_i=q_0+\sum\limits^{n-1}_{i=0}r^ic_0=q_0+\frac{1-r^n}{1-r}c_0\\
代入边界条件得c_0=\frac{1-r}{1-r^b}\\
因此q_n=q_0+\frac{1-r^n}{1-r^b}=\frac{1-r^n}{1-r^b}
\end{array}
\]
被左吸收璧吸收
\(即边界条件为:\)
\[q_0=1,q_b=0
\]
\(同样地我们根据迭代式:\)
\[\begin{array}{rcl}
q_n&=&q_0+\sum\limits^{n-1}_{i=0}q_{i+1}-q_i\\
&=&q_0+\sum\limits^{n-1}_{i=0}c_i\\
\end{array}\]
\(与上面一样滴,我们需要边界条件求出q_n\)
\(1.p\neq q:\)
\[c_i=rc_{i-1}=...=r^ic_0
\]
\[\begin{align}
\therefore q_n&=q_0+\sum\limits^{n-1}_{i=0}c_i \notag\\
&=q_0+c_0\sum\limits^{n-1}_{i=0}r^i \notag\\
&=q_0+c_0\cdot \cfrac{1-r^n}{1-r} \tag{1}\\
\end{align}\]
\(将n=b带入:\)
\[\begin{array}{rcl}
q_b&=&q_0+c_0\cfrac{1-r^b}{1-r}\\
c_0&=&\cfrac{(q_b-q_b)(1-r)}{(1-r^b)}=\cfrac{r-1}{1-r^b}\\
\end{array}\]
\(再代回(1)即得\)
\[\begin{array}{ccc}
q_n&=q_0+\cfrac{r-1}{1-r^b}\cdot\cfrac{1-r^n}{1-r}&\\
&=q_0-\cfrac{1-r^n}{1-r^b}&=1-\cfrac{1-r^n}{1-r^b}\\
& &=\cfrac{r^n-r^b}{1-r^b}
\end{array}\]
\(所以这就是我们的最终结果\\
(上面赌博问题所求的就是被左壁吸收的q_5,r=\frac{q}{p}=\frac{45.85\%}{1-45.85\%})\)
附录(以下内容纯属扯蛋)
\(我们进而引出下一个问题:\)
"现在处于Valorant的平局,但是我们的烟位想上厕所.我们平均还要打几局才能结束\(\longrightarrow\) 如果需要很多局我们就直接叫平,否则多打几把再去如厕"
又或者
"我是Valorant的程序员,我希望这场对局是安全的(不发生内存溢出)所以我需要设置一个《最大局数》.以避免无限加时导致的对局记录太大把内存塞满"
\[\begin{array}
{cl}
\hline
符号 & 说明 \\
\hline
\tau &结束该对局所需的局数 \\
X &以右壁吸收(以我方胜利)结束该对局所需的局数 \\
\hline
\end{array}
\]
\(条件:p=q=\frac12\)
\[\mathbb{E}[X]=\sum\limits_{n=2,4,...}n\cdot\mathbb{P}(X=n)
\]
\(若我们固定n,如n=2,4,6,8...(易见被右壁吸收而结束对局所需的局数一定为偶数)\)
\(因为无意义游动仅发生在\)
\[2\longrightarrow 1 \longrightarrow 2 或2\longrightarrow 3 \longrightarrow 2
\]
\(而其中无意义的游动共:2^\frac{n-2}{2}种\)
\(因此\)
\[\begin{array}{rcl}
\mathbb{P}(\tau=n) &=& (\frac{1}{2})^n \cdot 2^\frac{n-2}{2} + (\frac{1}{2})^n \cdot 2^\frac{n-2}{2}\\
&=&2^{-\frac{n}{2}-1}\cdot 2\\
\mathbb{E}[\tau] &=&\sum\limits^{\infty}_{n=2,4,...}n[2^{-\frac{n}{2}-1}+2^{-\frac{n}{2}-1}]=2\cdot\sum\limits^{\infty}_{n=2,4,...}n\cdot 2^{-\frac{n}{2}-1}=2\mathbb{E}[X]
\end{array}\]
\(改一下符号:i=\frac{n}{2}:\)
\[\begin{array}{rcl}
\mathbb{E}[X]&=&\sum\limits^{\infty}_{i=1}2i\cdot2^{-i-1}\\
&=&\sum\limits^{\infty}_{i=1}i\cdot2^{-i}\\
&=&\underset{m\rightarrow\infty}{lim}\sum\limits^{m}_{i=1}i\cdot2^{-i}\overset{\Delta}{=}\underset{m\rightarrow\infty}{lim}S_m\\
\frac12S_m&=&\sum\limits^{m}_{i=1}i\cdot(\frac12)^{i+1}\\
(1-\frac12)S_m&=&\sum\limits^{m}_{i=1}i\cdot(\frac12)^{i}-\sum\limits^{m}_{i=1}i\cdot(\frac12)^{i+1}\\
&=&[\frac12+\sum\limits^{m-1}_{i=1}(i+1)\cdot(\frac12)^{i+1}]-[\sum\limits^{m-1}_{i=1}i\cdot(\frac12)^{i+1}+m(\frac12)^m]\\
&=&\frac12+\sum\limits^{m-1}_{i=1}(\frac12)^{i+1}-m(\frac12)^m\\
S_m&=&2-(\frac12)^{m-1}-m(\frac12)^m\\
\therefore \underset{m\rightarrow\infty}{lim}S_m&=&2
\end{array}\]
\(即被右壁吸收的平均局数为:\)
\[\mathbb{E}[X]=2
\]
\(所以\)
\[\mathbb{E}[\tau]=2\mathbb{E}[X]=4
\]
即平均需要4局来结束,因此按Valorant的一局2mins来计算,若烟位队友的光容器不足以承受8mins的洪流的话,还是叫平吧!
然而仅仅知道\(\mathbb{E}[\tau]=4\)并不能为我们的Volorant程序员提供建议,又或者光容器"大概率"能撑20mins,那我们应该加时几局呢?
我们不妨这样考虑:
如果我们能用一个分布去拟合这组样本,那么我们可以用统计概率去确定样本落在均值附近范围多少(95%)
(当然我们可以直接将泊松作为拟合的分布(仅单参,以\(\lambda=4\)代入即可))
这里多考虑一个Gamma分布:
\[Z\thicksim Gamma(\alpha,\lambda)
\left\{
\begin{array}{}
\mathbb{E}[Z]=\cfrac{\alpha}{\lambda}=4\\
Var[Z]=\cfrac{\alpha}{\lambda^2}=???
\end{array}
\right.\]
\[\begin{array}{rcl}
Var(\tau)&=&\mathbb{E}[\tau^2]-\mathbb{E}^2[\tau]\\
&=&\mathbb{E}[\tau^2]-4\\
\mathbb{E}[\tau^2]&=&\sum\limits^{\infty}_{n=2,4,...}n^2\mathbb{P}(\tau=n)\\
&=&\sum\limits^{\infty}_{n=2,4,...}n^2\cdot2^{-\frac{n}{2}}\\
&=&\sum\limits^{\infty}_{i=1}4i^2\cdot 2^{-i}\\
&=&\underset{m\rightarrow\infty}{lim}\sum\limits^{m}_{i=1}4i^2\cdot 2^{-i}\\
&=&\underset{m\rightarrow\infty}{lim}W_m\\
(1-\frac12)W_m&=&\sum\limits^{m}_{i=1}i^2\cdot(\frac12)^{i-2}-\sum\limits^{m}_{i=1}i^2\cdot(\frac12)^{i-1}\\
&=&[2+\sum\limits^{m-1}_{i=1}(i+1)^2\cdot(\frac12)^{i-1}]-[\sum\limits^{m-1}_{i=1}i^2\cdot(\frac12)^{i-1}+m^2(\frac12)^{m-1}]\\
&=&2+\sum\limits^{m-1}_{i=1}(2i+1)(\frac12)^{i-1}-m^2(\frac12)^{m-1}\\
&=&2+4S_{m-1}+2-(\frac12)^{m-2}-\cfrac{m^2}{2^{m-1}}\\
W_m&=&8+8S_{m-1}-\cfrac{2+m^2}{2^{m-2}}\\
\underset{m\rightarrow\infty}{lim}W_m&=&8+8*2=24
\end{array}\]
\(综上:\)
\[Var(\tau)=\mathbb{E}[\tau^2]-\mathbb{E}^2[\tau]=24-4^2=8
\]
\[联立
\left\{
\begin{array}{}
\mathbb{E}[Z]=\cfrac{\alpha}{\lambda}=4\\
Var[Z]=\cfrac{\alpha}{\lambda^2}=8
\end{array}
\right.
\left\}
\begin{array}{}
\\
\\
\\
\end{array}
\right.
\left\{
\begin{array}{}
\lambda=\cfrac12\\
\\
\alpha=2
\end{array}
\right.\\
\therefore Z\thicksim Gamma(2,\cfrac12)
\]
利用Gamma分布的统计信息即可找出所有样本点的概率(doge)
这时候就可以为诸位蛙人的如厕问题提供指导