微信扫一扫打赏支持

泊松分布通俗理解

泊松分布通俗理解

一、总结

一句话总结:

泊松分布可以通过无限细分的二项分布推出来,求极限的话就是得到的结果就是泊松分布
$$P ( X = k ) = \frac { \mu ^ { k } } { k ! } e ^ { - \mu }$$

 

 

二、泊松分布(转)

转自:https://www.matongxue.com/madocs/858

 

1 甜在心馒头店

公司楼下有家馒头店:

马同学高等数学

每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?

老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):


\begin{array}{c|c}
    \qquad\qquad&\qquad销售\qquad\\
    \hline\color{SkyBlue}{周一}& 3 \\
    \hline \color{blue}{周二}& 7 \\
    \hline \color{orange}{周三}&4\\
    \hline \color{Goldenrod}{周四}&6\\
    \hline \color{green}{周五}&5\\
\end{array}

均值为:

\overline{X}=\frac{3+7+4+6+5}{5}=5

按道理讲均值是不错的选择(参见“如何理解最小二乘法?”),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,40\%的时间不够卖:


\begin{array}{c|c}
    \qquad\qquad&\qquad销售\qquad&\quad备货五个\\
    \hline\color{SkyBlue}{周一}& 3 \\
    \hline \color{blue}{周二}& 7&\color{red}{不够} \\
    \hline \color{orange}{周三}&4\\
    \hline \color{Goldenrod}{周四}&6&\color{red}{不够}\\
    \hline \color{green}{周五}&5\\
\end{array}

你“甜在心馒头店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

2 老板的思考

老板尝试把营业时间抽象为一根线段,把这段时间用T来表示:

马同学高等数学

然后把\color{SkyBlue}{周一}的三个馒头(甜在心馒头是有褶子的馒头)按照销售时间放在线段上:

马同学高等数学

T均分为四个时间段:

马同学高等数学

此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:

马同学高等数学

在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出):

 

T内那么卖出3个馒头的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。

这样的概率通过二项分布来计算就是:

\binom{4}{3}p^3(1-p)^1

但是,如果把\color{blue}{周二}的七个馒头放在线段上,分成四段就不够了:

马同学高等数学

从图中看,每个时间段,有卖出3个的,有卖出2个的,有卖出1个的,就不再是单纯的“卖出、没卖出”了。不能套用二项分布了。

解决这个问题也很简单,把T分为20个时间段,那么每个时间段就又变为了抛硬币:

马同学高等数学

这样,T内卖出7个馒头的概率就是(相当于抛了20次硬币,出现7次正面):

\binom{20}{7}p^7(1-p)^{13}

为了保证在一个时间段内只会发生“卖出、没卖出”,干脆把时间切成n份:

\binom{n}{7}p^7(1-p)^{n-7}

越细越好,用极限来表示:

\lim_{n\to\infty}\binom{n}{7}p^7(1-p)^{n-7}

更抽象一点,T时刻内卖出k个馒头的概率为:

\lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}

p的计算

“那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率p怎么求?”

在上面的假设下,问题已经被转为了二项分布。二项分布的期望为:

E(X)=np=\mu

那么:

p=\frac{\mu}{n}

4 泊松分布

有了p=\frac{\mu}{n}了之后,就有:

\lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}=\lim_{n\to\infty}\binom{n}{k}\frac{\mu}{n}^k(1-\frac{\mu}{n})^{n-k}

我们来算一下这个极限:


\begin{align}
\lim_{n\to\infty}\binom{n}{k}\frac{\mu}{n}^k(1-\frac{\mu}{n})^{n-k}&= \lim_{n\to\infty}\frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}\frac{\mu^k}{n^k}\left(1-\frac{\mu}{n}\right)^{n-k}\\
    &=\lim_{n\to\infty}\frac{\mu^k}{k!}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}\left(1-\frac{\mu}{n}\right)^n
\end{align}

其中:


\lim_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}=1

\lim_{n \to \infty}\left(1-\frac{\mu}{n}\right)^n = e^{-\mu}

所以:


\lim_{n\to\infty}\binom{n}{k}\frac{\mu}{n}^k(1-\frac{\mu}{n})^{n-k}=\frac{\mu^k}{k!}e^{-\mu}

上面就是泊松分布的概率密度函数,也就是说,在T时间内卖出k个馒头的概率为:

P(X=k)=\frac{\mu^k}{k!}e^{-\mu}

一般来说,我们会换一个符号,让\mu=\lambda,所以:

P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}

这就是教科书中的泊松分布的概率密度函数。

5 馒头店的问题的解决

老板依然蹙眉,不知道\mu啊?

没关系,刚才不是计算了样本均值:

\overline{X}=5

可以用它来近似:

\overline{X}\approx\mu

于是:

P(X=k)=\frac{5^k}{k!}e^{-5}

画出概率质量函数的曲线就是:

马同学高等数学

可以看到,如果每天准备8个馒头的话,那么足够卖的概率就是把前8个的概率加起来:

马同学高等数学

这样93\%的情况够用,偶尔卖缺货也有助于品牌形象。

老板算出一脑门的汗,“那就这么定了!”

6 总结

这个故事告诉我们,要努力学习啊,要不以后馒头都没得卖。

生活中还有很多泊松分布。比如物理中的半衰期,我们只知道物质衰变一半的时间期望是多少,但是因为不确定性原理,我们没有办法知道具体哪个原子会在什么时候衰变?所以可以用泊松分布来计算。

还有比如交通规划等等问题。

 

三、泊松分布补充

1、泊松分布怎么计算

查表

2、一些二项分布难算的问题可以用泊松分布

泊松分布:例:证券部有1000个账户,每户提20%的概率是0.006,准备多少现金以95%以上的概率保证提款
X:提钱的用户数,二项分布:X~B(1000,0.006)
10*0.2=2万元,P{2X<=x}=P{X<=x/2}>=0.95
这里n=1000,P=0.006,np=6,满足用泊松分布算二项分布的规律,λ=np=6
P{X<=x/2}=Σ(k=0->x/2)(6^k)/(k!)*e^(-6)>=0.95 得x/2>=10,x>=20


3、二项分布用泊松分布来计算的条件

二项分布可以用泊松分布来近似,比如算0.99^20
n比较大,P比较小,np比较适中的时候,(n>=100,np<=10)

 

 

 
posted @ 2020-10-31 19:40  范仁义  阅读(1344)  评论(0编辑  收藏  举报