常见的概率分布

离散分布

0-1分布(伯努利分布)

它的分布律为:

P{X=k}=pk(1p)1k,k=0,1,(0<p<1)

0-1分布记作:Xb(1,p)

期望:E(X)=p

方差:D(X)=p(1p)

常用的场景:新生婴儿性别的登记,招生考试的录取,产品的是否合格,硬币的正反面。

二项分布

二项分布为n重伯努利实验的概率分布。

分布律为:

P{X=k}=(nk)pk(1p)nk,k=0,1,2,...,n,(0<p<1)

nk=0P{X=k}=nk=0(nk)pk(1p)nk=(p+1p)n=1

二项分布记作:Xb(n,p)

期望:E(X)=np

方差:D(X)=np(1p)

常用的场景:比如一个人射击n次,其中k次命中的概率,抽查50台设备,其中10台出故障的概率等等。

从下面的图中,我们可以看到命中次数先增加,到了3达到最大,之后又逐渐减少,一般来说,对于固定的n,p,都具有这一性质。

(1)当n+1p不为整数时,二项概率P{X=k}k=[(n+1)p]时达到最大值;

(2)当n+1p为整数时,二项概率P{X=k}k=(n+1)p,k=(n+1)p1时达到最大值。

%每轮射击10次,命中概率0.3,射击10000轮,x中返回的是每轮中命中的次数
x=binornd(10,0.3,10000,1);
%bin的数目为10
hist(x,10);

image

复制代码
N=100;
p=0.4;
k=0:N;
%事件发生k次的概率
pdf=binopdf(k,N,p);
%事件发生不大于k次的概率
cdf=binocdf(k,N,p);
plotyy(k,pdf,k,cdf);
grid on;
复制代码

image

多项分布

    多项式分布是二项式分布的扩展,在多项式分布所代表的实验中,一次实验会有多个互斥结果,而二项式分布所代表的实验中,一次实验只有两个互斥结果。

    把二项扩展为多项就得到了多项分布。比如扔骰子,不同于扔硬币,骰子有6个面对应6个不同的点数,这样单次每个点数朝上的概率都是1/6(对应p1~p6,它们的值不一定都是1/6,只要和为1且互斥即可,比如一个形状不规则的骰子),重复扔n次,如果问有x次都是点数6朝上的概率就是:

Cxnpx(1p)nx

更一般性的问题会问:点数1~6的出现次数分别为(x1,x2,x3,x4,x5,x6)时的概率是多少?其中sum(x1~x6)= n。这就是一个多项式分布问题。这时只需用上边公式思想累乘约减就会得到下面的概率公式

某随机实验如果有k个可能结局A1,A2,,Ak,分别将他们的出现次数记为随机变量X1,X2,,Xk,它们的概率分布分别是p1,p2,,pk,那么在n次采样的总结果中,A1出现n1次、A2出现n2次、…、Ak出现nk次的这种事件的出现概率P有下面公式:

P(X1=n1,...,Xk=nk)={n!n1!...nk!pn11...pnkk,ki=1ni=n0,others


用另一种形式写为:

P(X1=n1,...,Xk=nk)={n!ki=1pniini!,ki=1ni=n0,others

其中ki=1pi=1

期望: 设r维随机变量(x1,x2,,xr)服从多项分布,则数学期望是

E(x1,x2,,xn)=(np1,np2,,npr)

方差:Var(xi)=npi(1pi)i=1,2,,r

泊松分布

概率分布为:

P{X=k}=λkeλk!,k=0,1,2,...,λ>0

泊松分布记作:Xπ(λ)

k=0P{X=k}=k=0λkeλk!=eλeλ=1,k=0,1,2,...,λ>0

期望:E(X)=λ

方差:D(X)=λ

常用场景:一天内网站的访问量,某段时间内发生的交通事故等等。泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。

对于二项分布,如果npn=λ.可以用泊松分布来近似二项分布。

下面的代码画出泊松分布的概率密度图和分布图。

x=0:1:20;
%lambda=5,泊松概率密度
y=poisspdf(x,5);
plot(x,y);
%lambda=5,泊松概率分布
y1=poisscdf(x,5);
figure;
plot(x,y1);
image

image

负二项分布(帕斯卡分布)

进行重复试验时,直到某个事件出现了r次时停止试验,此时试验进行次数X服从负二项分布,为二项分布的变体,注意到最后一次一定是成功的,所以是Cr1k1而不是Crk

概率分布为:

P{X=k}=Cr1k1pr(1p)kr,k=r+1,r+2,...,n,(0<p<1)

负二项分布记作:Xb0(r,p)

期望:E(X)=rp

方差:D(X)=r(1p)p2

常用的场景: 比如抽查20台设备,如果出现3次失败就停止抽查,全面停工。

几何分布

负二项分布中,r=1时的特殊情况,即第1次试验成功时,试验进行的次数X的分布。

概率分布为:

P{X=k}=p(1p)k,k=0,1,...,n,(0<p<1)

负二项分布记作:Xb0(r,p)

期望:E(X)=1p

方差:D(X)=(1p)p2

常用的场景: 比如抽查20台设备,如果设备故障,立即停工检修。

超几何分布

to do

单点分布(退化分布)

随机变量取a时,概率为1。

记作: b0(a,1)

单点分布记作:p(x=a)=1

期望:a

方差:0


连续分布

均匀分布

随机变量的概率密度在[a,b]区间上为常数1ba,则此随机变量服从均匀分布,意为在某个区间内各取值是等可能的,概率的大小只与长度有关。

均匀分布概率密度函数:

f(x)={1ba,a<x<b0,others

均匀分布分布函数:

F(x)={0,x<axaba,ax<b1,xb

均匀分布记作: U(a,b)

期望:E(X)=(a+b)2

方差:D(X)=(ba)212

正态分布(高斯分布)

http://www.cnblogs.com/mikewolf2002/p/7669977.html

指数分布

为伽玛分布的特殊形式,即当α=1时的伽玛分布。

均匀分布概率密度函数:

f(x)={1θex/θ,x>00,others

均匀分布分布函数:

F(x)={1ex/θ,x>00,others

均匀分布记作: Γ(a,b)

期望:E(X)=θ

方差:D(X)=θ2

指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。

用下面的代码,我们可以画出指数分布的概率密度函数和分布函数图:

x=0:0.1:5;
plot(x,[gampdf(x,1,0.3);gampdf(x,1,1);gampdf(x,1,2)]);
legend('theta=0.3','theta=1','theta=2');
grid on;
figure;
plot(x,[gamcdf(x,1,0.3);gamcdf(x,1,1);gamcdf(x,1,2)]);
legend('theta=0.3','theta=1','theta=2');
grid on;

imageimage


Γ(伽马分布)

http://www.cnblogs.com/mikewolf2002/p/7664944.html

χ2分布(卡方分布)

http://www.cnblogs.com/mikewolf2002/p/7664944.html

t分布(学生氏分布)

to do

非中心t分布

to do

F分布

to do

非中心F分布

to do

对数正态分布

to do

逆高斯分布

to do

非中心χ2分布

to do

韦布尔分布

to do

拉普拉斯分布

to do

瑞利分布

to do

帕雷托分布

to do

极值分布

to do

逻辑斯谛分布

to do

B分布(贝塔分布)

to do

柯西分布

to do


posted on   迈克老狼2012  阅读(5550)  评论(0编辑  收藏  举报

编辑推荐:
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· Vue3状态管理终极指南:Pinia保姆级教程
历史上的今天:
2013-10-14 Kmeans算法原理极其opencv实现(转帖)

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示