B-概率论-常见的概率分布模型
- 常见的概率分布模型
- 一、离散概率分布函数
- 二、连续概率分布函数
- 三、联合分布函数
- 四、多项分布(Multinomial Distribution)
- 五、伯努利分布(Bernoulli Distribution)
- 六、正态(高斯)分布(Normal(Gaussian) Distribution)
- 七、泊松分布(Poisson Distribution)
- 八、二项分布(Binomial Distributio)
- 九、贝塔分布(Beta Distribution)
- 十、几何分布(负二项分布)(Geometric Distribution)
- 十一、狄利克雷分布(多项分布的共轭分布)(Dirichlet distribution)
- 十二、超几何分布(Hypergeometric Distribution)
- 十三、指数分布(Exponential Distribution)
更新、更全的《机器学习》的更新网站,更有python、go、数据结构与算法、爬虫、人工智能教学等着你:https://www.cnblogs.com/nickchen121/p/11686958.html
常见的概率分布模型
一、离散概率分布函数
离散概率分布也称为概率质量函数(probability mass function),离散概率分布的例子有
伯努利分布(Bernoulli distribution)
二项分布(binomial distribution)
泊松分布(Poisson distribution)
几何分布(geometric distribution)等
二、连续概率分布函数
连续概率分布也称为概率密度函数(probability density function),它们是具有连续取值(例如一条实线上的值)的函数,连续概率分布的例子有
正态分布(normal distribution)
指数分布(exponential distribution)
β分布(beta distribution)等
三、联合分布函数
给定一个随机变量,称定义域为整个平面的二元实值函数
该二元实值函数为随机变量的分布函数,也可以称为是的联合分布函数。
按照联合分布函数的定义,,其中如下图所示
四、多项分布(Multinomial Distribution)
4.1 多项分布简介
多项分布是二项分布的推广,他们的区别是二项分布的结果只有和两种,多项式的结果可以有多个值。
多项分布的典型例子是掷骰子,6个点对应6个不同的数,每个点的概率都为
与二项分布类似,多项分布来自于
4.2 多项分布公式解析
以掷骰子为例,掷骰子的时候掷的概率都为,记作,可以发现,现在把记作做一次抽样各种事件发生的概率和,即可得为次抽样所有事件相互组合对应的概率和,之后使用多项式展开(注:使用多项式定理展开,由于多项式定理不在本节提及范围内,不多赘述),如果它不是掷骰子,而是一个有种可能的问题,会得到一个多项式展开的公式
这个多项式表示出现次,出现次,,出现次的出现概率,这样就得到了上述所示的多项分布的多项展开式公式。
五、伯努利分布(Bernoulli Distribution)
5.1 伯努利分布简介
伯努利分布是一个二值离散分布,结果只有和两种。
随即变量为的概率为,则为的概率为,可以用公式表示为
5.2 伯努利分布的期望值和方差
伯努利分布的期望值为
伯努利分布的方差为
六、正态(高斯)分布(Normal(Gaussian) Distribution)
6.1 正态分布的概率密度函数图像
其中红线表示的是标准正态分布图像。
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
%matplotlib inline
mu1 = 0
sig1 = 1
mu2 = 0
sig2 = 2
x = np.arange(-5, 5, 0.1)
y1 = stats.norm.pdf(x, mu1, sig1)
y2 = stats.norm.pdf(x, mu2, sig2)
plt.plot(x, y1, 'r-', label='\(\mu=0,\sigma^2=1\)')
plt.plot(x, y2, 'b-', label='\(\mu=0,\sigma^2=2\)')
plt.legend()
plt.show()
6.2 正态分布简介
正态分布也称作高斯分布,是最常见的一种分布,其概率密度函数为
如果一个随即变量服从该分布,可以写作。
当时的正态分布称作标准正态分布,这个分布能简化为
标准正态分布曲线区间面积计算
6.3 中心极限定理与正态分布
- 中心极限定理1:把许多未知的小作用加起来看作一个变量,这个变量服从正态分布
- 中心极限定理2:“大量统计独立的随即变量的和”的分布趋于正态分布
七、泊松分布(Poisson Distribution)
7.1 泊松分布的概率质量函数图像
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
%matplotlib inline
lambd = 2.5
x = np.arange(0, 10)
y = stats.poisson.pmf(x, lambd)
plt.plot(x, y, label='\(\lambda=2.5\)')
plt.legend()
plt.show()
八、二项分布(Binomial Distributio)
8.1 二项分布的概率质量函数图像
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
%matplotlib inline
n = 8
p = 0.4
x = np.arange(0, 20)
y = stats.binom.pmf(x, n, p)
plt.plot(x, y, 'o-', label='\(n=8,p=0.4\)')
plt.legend()
plt.show()
8.2 二项分布简介
二项分布是次独立的二值实验(伯努利实验)中成功的次数的离散值概率分布(次伯努利实验,一次伯努利实验得到一个伯努利分布)。
随机变量服从参数和的二项分布记作:。次实验中次成功的概率质量函数为
其中是二项式系数:
二项分布来源于牛顿二项式
8.3 二项分布与伯努利分布
- 二项分布的期望是伯努利分布期望的倍
- 二项分布的方差是伯努利分布方差的倍
九、贝塔分布(Beta Distribution)
9.1 贝塔分布的概率密度函数图像
from scipy import stats
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
a = 0.4
b = 0.6
x = np.arange(0.01, 1, 0.01)
y = stats.beta.pdf(x, a, b)
plt.plot(x, y, label='a=0.4,b=0.6')
plt.show()
十、几何分布(负二项分布)(Geometric Distribution)
10.1 几何分布概率质量函数图像
十一、狄利克雷分布(多项分布的共轭分布)(Dirichlet distribution)
十二、超几何分布(Hypergeometric Distribution)
十三、指数分布(Exponential Distribution)
13.1 指数分布概率密度函数图像
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats
%matplotlib inline
lambd = 0.6
x = np.arange(0, 10, 0.1)
y = lambd * np.exp(-lambd*x)
plt.plot(x, y, label='\(\lambda=0.6\)')
plt.legend()
plt.show()