Valorant如厕问题学习笔记

最近遇到了很多带吸收璧的随机游动问题,且自己老是忘,又要回去翻书,索性直接写在这里方便自己翻阅。

例子引入

问题一

https://www.bilibili.com/video/BV1yV4y1k78J/?vd_source=67f30ac66578cfd789284b232e6fd4b8

位置6:24

把题干提炼一下:

\( Q1:本金5000,胜率为p,败率为q\overset{\Delta}{=}1-p,,每次以1000进行赌局:(胜则为Bonus,输直接为0).求输光的概率 \\ \)
\( 这里先直接给出结果:\\ 当取Bonus=2000(即胜则翻倍)时: \)

\[P(输光的概率|此时手上5000)\overset{\Delta}{=}P_{lose}= \cfrac{(\frac{p}{q})^5-(\frac{p}{q})^{n}}{1-(\frac{p}{q})^{n}} =\cfrac{(\frac{1-q}{q})^5-(\frac{1-q}{q})^{n}}{1-(\frac{1-q}{q})^{n}} \]


问题二

再者是Valorant(csgo,传统体育运动)的赛点加时

Q2:加时赛:\(|Score_A-Score_B|=2\)时结束该局对局:(实际上当两方实力相当时由于对称性当然易见\(P_{win}=P_{lose}=0.5\))

\(这里同样地先直接给出结果:\\\)

\[P(赢下对局的概率|此时战平)\overset{\Delta}{=}P_{win}= \left\{ \begin{aligned} \frac{(\frac{p}{q})^2-(\frac{p}{q})^{4}}{1-(\frac{p}{q})^{4}} && \text{if} && p\neq q\\ \frac{n}{a+b}=\frac{2}{2+2}=\frac12 && \text{if} && p=q \end{aligned} \right. \]

\(如果当前状态不是平局状态,而是某一方领先1分(不妨设为我方),也能求出结果\)

\[P(赢下对局的概率|此时我方领先1分)\overset{\Delta}{=}P_{win}= \left\{ \begin{aligned} \frac{1-r^n}{1-r^{a+b}}=\frac{1-(\frac{p}{q})^3}{1-(\frac{p}{q})^{2+2}} && \text{if} && p\neq q\\ \frac{n}{a+b}=\frac{3}{2+2}=\frac34 && \text{if} && p=q \end{aligned} \right. \]

一般情况

两个问题无非都可以看成一个点以不同的概率分别向左向右移动。比如说第一个问题就是在

\[\left\{ \begin{array}{l} (0,+\infty)上随机游动(这里右吸收璧任取一个结束点即可)\\ 起点为x=5\\ 亏完点为x=0\\ 以概率P_{lose}向左移动1格,以概率P_{win}向右移动1格\\ \end{array} \right. \]

第二个问题就是在

\[\left\{ \begin{array}{l} [0,4]上随机游动\\ 起点为x=2\\ 对局结束点为x=0 \quad or \quad x=4\\ 以概率P_{lose}向左移动1格,以概率P_{win}向右移动1格 \end{array} \right. \]

这种问题被称为带吸收璧的随机游动

把前面的符号颠覆。重新定义符号含义便于推导:

\[\begin{array} {cl} \hline 符号 & 说明 \\ \hline p &状态点向左移动的概率 \\ q &状态点向右移动的概率(q=1-p) \\ q_0&P(被右壁吸收,初始位于x=0) \\ q_b&P(被右壁吸收,初始位于x=b) \\ q_n &P(被右壁吸收,初始位于x=n) \\ r &\overset{\Delta}{=}\cfrac{q}{p}(为了化简用 ) \\ c_n &\overset{\Delta}{=}q_{n+1}-q_n(为了化简用) \\ \hline \end{array} \]

\[\begin{array}{rcl} q_n&=&pq_{n+1}+qq_{n-1}\\ (p+q)q_n&=&pq_{n+1}+qq_{n-1}\\ q(q_n-q_{n-1})&=&p(q_{n+1}-q_n)\\ qc_{n-1}&=&pc_n\\ c_{n}&=&\cfrac{q}{p}c_{n-1}\\ c_{n}&=&rc_{n-1}\\ 以及边界条件q_{0}=0&,&q_b=1\\ \end{array} \]

\[ \]

被右吸收璧吸收

\(p=q\)

\[\begin{array}{l} \therefore q_n=q_0+\sum\limits^{n-1}_{i=0}(q_{i+1}-q_i)=q_0+nc\\ 代入边界条件得c=\frac{1}{b}\\ 因此q_n=\frac{n}{b} \end{array} \]

\(q\neq p\)

\[\begin{array}{l} \therefore q_n=q_0+\sum\limits^{n-1}_{i=0}(q_{i+1}-q_i)=q_0+\sum\limits^{n-1}_{i=0}c_i=q_0+\sum\limits^{n-1}_{i=0}r^ic_0=q_0+\frac{1-r^n}{1-r}c_0\\ 代入边界条件得c_0=\frac{1-r}{1-r^b}\\ 因此q_n=q_0+\frac{1-r^n}{1-r^b}=\frac{1-r^n}{1-r^b} \end{array} \]

被左吸收璧吸收

\(即边界条件为:\)

\[q_0=1,q_b=0 \]

\(同样地我们根据迭代式:\)

\[\begin{array}{rcl} q_n&=&q_0+\sum\limits^{n-1}_{i=0}q_{i+1}-q_i\\ &=&q_0+\sum\limits^{n-1}_{i=0}c_i\\ \end{array}\]

\(与上面一样滴,我们需要边界条件求出q_n\)
\(1.p\neq q:\)

\[c_i=rc_{i-1}=...=r^ic_0 \]

\[\begin{align} \therefore q_n&=q_0+\sum\limits^{n-1}_{i=0}c_i \notag\\ &=q_0+c_0\sum\limits^{n-1}_{i=0}r^i \notag\\ &=q_0+c_0\cdot \cfrac{1-r^n}{1-r} \tag{1}\\ \end{align}\]

\(将n=b带入:\)

\[\begin{array}{rcl} q_b&=&q_0+c_0\cfrac{1-r^b}{1-r}\\ c_0&=&\cfrac{(q_b-q_b)(1-r)}{(1-r^b)}=\cfrac{r-1}{1-r^b}\\ \end{array}\]

\(再代回(1)即得\)

\[\begin{array}{ccc} q_n&=q_0+\cfrac{r-1}{1-r^b}\cdot\cfrac{1-r^n}{1-r}&\\ &=q_0-\cfrac{1-r^n}{1-r^b}&=1-\cfrac{1-r^n}{1-r^b}\\ & &=\cfrac{r^n-r^b}{1-r^b} \end{array}\]

\(所以这就是我们的最终结果\\ (上面赌博问题所求的就是被左壁吸收的q_5,r=\frac{q}{p}=\frac{45.85\%}{1-45.85\%})\)

附录(以下内容纯属扯蛋)

\(我们进而引出下一个问题:\)

"现在处于Valorant的平局,但是我们的烟位想上厕所.我们平均还要打几局才能结束\(\longrightarrow\) 如果需要很多局我们就直接叫平,否则多打几把再去如厕"

又或者

"我是Valorant的程序员,我希望这场对局是安全的(不发生内存溢出)所以我需要设置一个《最大局数》.以避免无限加时导致的对局记录太大把内存塞满"

\[\begin{array} {cl} \hline 符号 & 说明 \\ \hline \tau &结束该对局所需的局数 \\ X &以右壁吸收(以我方胜利)结束该对局所需的局数 \\ \hline \end{array} \]

\(条件:p=q=\frac12\)

\[\mathbb{E}[X]=\sum\limits_{n=2,4,...}n\cdot\mathbb{P}(X=n) \]

\(若我们固定n,如n=2,4,6,8...(易见被右壁吸收而结束对局所需的局数一定为偶数)\)
\(因为无意义游动仅发生在\)

\[2\longrightarrow 1 \longrightarrow 2 或2\longrightarrow 3 \longrightarrow 2 \]

\(而其中无意义的游动共:2^\frac{n-2}{2}种\)
\(因此\)

\[\begin{array}{rcl} \mathbb{P}(\tau=n) &=& (\frac{1}{2})^n \cdot 2^\frac{n-2}{2} + (\frac{1}{2})^n \cdot 2^\frac{n-2}{2}\\ &=&2^{-\frac{n}{2}-1}\cdot 2\\ \mathbb{E}[\tau] &=&\sum\limits^{\infty}_{n=2,4,...}n[2^{-\frac{n}{2}-1}+2^{-\frac{n}{2}-1}]=2\cdot\sum\limits^{\infty}_{n=2,4,...}n\cdot 2^{-\frac{n}{2}-1}=2\mathbb{E}[X] \end{array}\]

\(改一下符号:i=\frac{n}{2}:\)

\[\begin{array}{rcl} \mathbb{E}[X]&=&\sum\limits^{\infty}_{i=1}2i\cdot2^{-i-1}\\ &=&\sum\limits^{\infty}_{i=1}i\cdot2^{-i}\\ &=&\underset{m\rightarrow\infty}{lim}\sum\limits^{m}_{i=1}i\cdot2^{-i}\overset{\Delta}{=}\underset{m\rightarrow\infty}{lim}S_m\\ \frac12S_m&=&\sum\limits^{m}_{i=1}i\cdot(\frac12)^{i+1}\\ (1-\frac12)S_m&=&\sum\limits^{m}_{i=1}i\cdot(\frac12)^{i}-\sum\limits^{m}_{i=1}i\cdot(\frac12)^{i+1}\\ &=&[\frac12+\sum\limits^{m-1}_{i=1}(i+1)\cdot(\frac12)^{i+1}]-[\sum\limits^{m-1}_{i=1}i\cdot(\frac12)^{i+1}+m(\frac12)^m]\\ &=&\frac12+\sum\limits^{m-1}_{i=1}(\frac12)^{i+1}-m(\frac12)^m\\ S_m&=&2-(\frac12)^{m-1}-m(\frac12)^m\\ \therefore \underset{m\rightarrow\infty}{lim}S_m&=&2 \end{array}\]

\(即被右壁吸收的平均局数为:\)

\[\mathbb{E}[X]=2 \]

\(所以\)

\[\mathbb{E}[\tau]=2\mathbb{E}[X]=4 \]

即平均需要4局来结束,因此按Valorant的一局2mins来计算,若烟位队友的光容器不足以承受8mins的洪流的话,还是叫平吧!

然而仅仅知道\(\mathbb{E}[\tau]=4\)并不能为我们的Volorant程序员提供建议,又或者光容器"大概率"能撑20mins,那我们应该加时几局呢?

我们不妨这样考虑:

如果我们能用一个分布去拟合这组样本,那么我们可以用统计概率去确定样本落在均值附近范围多少(95%)

(当然我们可以直接将泊松作为拟合的分布(仅单参,以\(\lambda=4\)代入即可))

这里多考虑一个Gamma分布:

\[Z\thicksim Gamma(\alpha,\lambda) \left\{ \begin{array}{} \mathbb{E}[Z]=\cfrac{\alpha}{\lambda}=4\\ Var[Z]=\cfrac{\alpha}{\lambda^2}=??? \end{array} \right.\]

\[\begin{array}{rcl} Var(\tau)&=&\mathbb{E}[\tau^2]-\mathbb{E}^2[\tau]\\ &=&\mathbb{E}[\tau^2]-4\\ \mathbb{E}[\tau^2]&=&\sum\limits^{\infty}_{n=2,4,...}n^2\mathbb{P}(\tau=n)\\ &=&\sum\limits^{\infty}_{n=2,4,...}n^2\cdot2^{-\frac{n}{2}}\\ &=&\sum\limits^{\infty}_{i=1}4i^2\cdot 2^{-i}\\ &=&\underset{m\rightarrow\infty}{lim}\sum\limits^{m}_{i=1}4i^2\cdot 2^{-i}\\ &=&\underset{m\rightarrow\infty}{lim}W_m\\ (1-\frac12)W_m&=&\sum\limits^{m}_{i=1}i^2\cdot(\frac12)^{i-2}-\sum\limits^{m}_{i=1}i^2\cdot(\frac12)^{i-1}\\ &=&[2+\sum\limits^{m-1}_{i=1}(i+1)^2\cdot(\frac12)^{i-1}]-[\sum\limits^{m-1}_{i=1}i^2\cdot(\frac12)^{i-1}+m^2(\frac12)^{m-1}]\\ &=&2+\sum\limits^{m-1}_{i=1}(2i+1)(\frac12)^{i-1}-m^2(\frac12)^{m-1}\\ &=&2+4S_{m-1}+2-(\frac12)^{m-2}-\cfrac{m^2}{2^{m-1}}\\ W_m&=&8+8S_{m-1}-\cfrac{2+m^2}{2^{m-2}}\\ \underset{m\rightarrow\infty}{lim}W_m&=&8+8*2=24 \end{array}\]

\(综上:\)

\[Var(\tau)=\mathbb{E}[\tau^2]-\mathbb{E}^2[\tau]=24-4^2=8 \]

\[联立 \left\{ \begin{array}{} \mathbb{E}[Z]=\cfrac{\alpha}{\lambda}=4\\ Var[Z]=\cfrac{\alpha}{\lambda^2}=8 \end{array} \right. \left\} \begin{array}{} \\ \\ \\ \end{array} \right. \left\{ \begin{array}{} \lambda=\cfrac12\\ \\ \alpha=2 \end{array} \right.\\ \therefore Z\thicksim Gamma(2,\cfrac12) \]

利用Gamma分布的统计信息即可找出所有样本点的概率(doge)
这时候就可以为诸位蛙人的如厕问题提供指导

posted @ 2023-05-15 17:25  动量不守恒的浩  阅读(170)  评论(0编辑  收藏  举报