泊松分布、泊松过程、泊松点过程
1.泊松分布##
泊松分布是二项分布的极限分布,假设有一列二项分布B(n,pn),均值为\(\lambda\),即\(\lim \limits_{n \rightarrow \infty} np_n=\lambda>0\),对任何非负整数k(即发生k次的概率)有\(\lim\limits_{n \rightarrow \infty} b(k;n,p_n)=\lim \limits_{n\rightarrow \infty}C^k_np_n^k(1-p_n)^{n-k}=e^{-\lambda}\frac{\lambda^k}{k!}\)。
证明:
\(\begin{align}
C^k_n p_n^k(1-p_n)^{n-k} &= \frac{n!}{k!(n-k)!}p_n^k(1-p_n)^{n-k}\\
&=\frac{1\times2\times3\times...\times n}{k!\times1\times2\times3...\times(n-k) \times n^k}(1-p_n)^{-k}(np_n)^k(1-p_n)^n\\
&=\frac{n\times(n-1)\times(n-2)\times...\times(n-k+1)}{k!\times n^k}(1-p_n)^{-k}(np_n)^k(1-p_n)^n\\
&=\frac{1}{k!}(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{k-1}{n})(1-p_n)^{-k}(np_n)^k(1-p_n)^n
\end{align}\)
注意到\(\lim \limits_{n \rightarrow \infty}(np_n)^k=\lambda^k\),和\(\lim \limits_{n \rightarrow \infty}(1-p_n)^n=e^{-\lambda}\)。
定理证毕。
泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可以近似地看成时参数\(\lambda=np\)的泊松分布。
2.泊松过程##
实验结果满足泊松分布的实验即为泊松过程。
3.泊松点过程##
泊松点过程其实和泊松过程并无区别。只是在我初接触的时候不自觉的把它当成一个二维的撒点过程。所以我想更多人会把这个术语当做是如何在二维平面撒满足泊松分布点的方法。放心,这里也是介绍方法的。
3.1一维的撒点方法###
3.1.1算法1####
我们注意到,在齐次泊松过程中,两次事件的距离是满足均值为\(\frac{1}{\lambda}\)的指数分布。
(0) 初始化 t = 0;
(1) 取一个满足均匀分布u~U(0,1)的随机数u;
(2) \(t = t - \frac{1}{\lambda}log(u)\);
(3) 生成一个点t;
(4) 返回(1)。
3.1.2算法2####
假设在固定的时长\([0,t_0]\),事件发生次数为\(N(t_0)=n,事件发生的时间\)T_1,T_2,...,T_n\((排序过的)满足均匀分布。
(1) 生成随机变量n满足泊松分布\)n\sim Poisson(\lambda t);
(2) 如果n=0,结束退出。否则,独立地生成\(u_1\sim U(0,1),u_2\sim U(0,1),...,u_n\sim U(0,1)\),然后将得到的\(u_i\)进行排序(按升序)得到\(u_{(1)},u_{(2)},u_{(3)},...,u_{(n)}\)
(3) \(t_i=t_0u_{(i)}, i=1,2,....,n\)
(4) 生成\(t_i\)。
3.2二维的撒点方法###
二维撒点满足的泊松分布最关键的唯一和一维的不同点在于泊松分布参数由\(\lambda t\)变为\(\lambda\times A(R)\),A(R)是区域R的容量(对更高维也可以用的定义)。在半径为r>0的的圆平面更容易完成满足泊松分布的撒点过程。
3.2.1算法1####
3.2.1.1定理1#####
假设\((R_1,\theta_1),(R_2,\theta_2),...,(R_N,\theta_N)\)是极坐标系中代表N>0的事件的位置,分布满足在圆\(C\equiv{(x,y):x^2+y^2\leq r^2}\)内的齐次泊松过程。设N=n,排好序的事件的半径\(R_{(1)},R_{(2)},...,R_{(n)}\)符合密度函数为\(f(z)=\frac{2z}{r^2},z\in[0,r]\)的分布,\(\theta_1,\theta_2,...,\theta_n\)独立同分布于均匀分布\(U[0,2\pi]\)并且和\(R_1,R_2,...,R_n\)独立。
下面就提出利用齐次泊松过程在半径为r的圆上生成N=n个点,满足参数为\(\pi r^2\lambda\)的泊松分布。生成的点的极坐标半径满足上述定理。
3.2.1.2算法实现#####
(0) \(n\sim Poisson(\pi r^2\lambda)\)。如果n=0,结束退出。否则,独立地生成\(u_1\sim U(0,1),u_2\sim U(0,1),...,u_n\sim U(0,1)\)
(1) \(R_1 \gets r\sqrt{u_1}, R_2 \gets r\sqrt u_2,... R_n \gets r\sqrt u_n\)。
(2) 对\(R_1,R_2,...,R_n\)排序(升序)得到\(R_{(1)},R_{(2)},...,R_{(n)}\)。
(3) 独立地生成\(u_{n+1}\sim U(0,1),u_{n+2}\sim U(0,1),...,u_{2n}\sim U(0,1)\)。
(4) \(\theta_1 \gets 2\pi u_{n+1},\theta_2 \gets 2\pi u_{n+2},...,\theta_n \gets 2\pi u_{2n}\)。
(5) 生成点的坐标\((R_{(1)},\theta_1),(R_{(2)},\theta_2),...,(R_{(n)},\theta_n)\)。
3.2.2算法2####
在更加不规则的区域内完成。如:感兴趣的区域为\(C\equiv{(x,y):x\ge 0,y\ge 0,y\le f(x), x\le T}\).其中排过序的\(X_{(1)},X_{(2)},...,X_{(N)}\)是事件的横坐标,那么\(\int_{X_(i-1)}^{X_(i)} f(x) dx, X_{(0)}=0,i=1,2,...,独立同分布于均值为\frac{1}{\lambda}的指数分布\)。其相应的纵坐标\(Y_i\)服从均匀分布\(U(0,f(X_{(i)}))\)
(0) 初始化\(j=1,n=0,w=0,x_0=0\).
(1) 独立地生成\(u_j\sim U(0,1)\).
(2) \(w_j\gets -\frac{1}{\lambda}ln(1-u_j)\).
(3) \(w\gets w+w_j\).
(4) 如果\(w \le \int_0^T f(x) dx\),那么\(n \gets n+1\)然后跳回到(1)
(5) 如果n=0,退出结束,否则,求解\(x_{(i)},i=1,2,...,n满足 \int_{x_(i-1)}^{x_(i)} f(x) dx =w_i\).
(6) 独立地生成\(u_{n+1}\sim U(0,1),u_{n+2}\sim U(0,1),...,u_{2n}\sim U(0,1)\).
(7) \(y_i \gets u_{n+i}f(x_i)\).
(8) 撒点\((x_{9i)},y_{(i)}),i=1,2,...,n\).
3.2.3算法3####
更普适理论的算法
(1) \(n \sim Poisson(\lambda A(C))\).
(2) 如果n=0,退出结束。否则生成n个点\((x_i,y_i),i=1,2,...,n\)在C中均匀分布。
(3) 撒点\((x_i,y_i)\).
注意:如果区域C不是规则的,那么步骤2不能直接得到,在二维情景中,可以生成一个矩形区域C'包含区域C。
Reference:Generating Homogeneous Poisson Processes。