概率分布函数和概率密度函数

2021.10.25

张宇考研概率论强化班_哔哩哔哩_bilibili

数学要做一件事情，就是把这些随机事件进行统一化，数量化。

ω代表具体发生的一个事件，X代表一个特殊的映射，X=X(ω)，这样就把具体的事件映射到数轴上一个具体的数值。

如投篮：投进映射成1，投不进映射成0.

一般的函数如果是取10，就是一个确定的值，没有概率。但是ω是以一定的概率取某个值（比如取掷骰子的3点），或者发生某件事情。映射出来的函数值自然也是有概率的。因为X是随机出现的变量，简称随机变量。

X起到的作用就是映射统一化。

注解：

1.ω具有随机性，所以映射出的X也具有随机性，这叫随机变量。

注解：

1.x是确定性变量，y也是确定变量。

随机事件也要用上微积分，不然白发明了。怎么用上呢？

大多数函数都是连续可导，指数函数，对数函数，。。。这些都能用上微积分，如求导。可以利用微积分的知识求最值。

ω是一个事件，谈不上连续，可导。所以要让随机事件连续，可导，那就只能制造一个函数：F(x)，它定义为：一个事件发生的概率。

注解：

1.小x要取遍(-∞,+∞)内所有的数。分布函数的定义域是(-∞,+∞)，即在整个实数域上处处有定义的函数。

注解：

1.随机事件映射到数轴上的数不可能小于-∞，所以小x趋于-∞时是不可能事件。不可能事件的概率是0，此时，F(x)=0

注解：

1.随机事件映射到数轴上的数一定小于+∞，所以小x趋于+∞时X(ω)≤+∞是必然事件。必然事件的概率是1，此时，F(x)=1

什么样子的函数是分布函数？分布函数具有哪些特点？

1.分布函数的值是概率值。

注解：

1.右连续。

2.一个题目：

3.分布函数一定是非负的，因为它是概率的累加。

注解：

1.可以用掷骰子的例子考虑，p(x=1)=1/6,p(x=2)=1/6,p(x=3)=1/6,p(x=4)=1/6,p(x=5)=1/6,p(x=6)=1/6。

注解：

1.f(x)很奇妙的一个函数。

概率分布和概率密度是什么意思？

概率分布的着眼点是概率。满足（概率）分布律的随机变量叫做离散型随机变量，可以用掷骰子为例思考。

律：规律。

注解：

1.满足上面那个积分式子的随机变量叫做连续型随机变量.

2.只要谈概率密度函数，一定是连续型随机变量，只要谈概率分布，一定是离散型随机变量。

注解：

1.高一点的地方密度大，低一点的地方密度小。

2.概率密度函数中的密度是借鉴物理学中的概念。

注解：

1.因为概率密度函数在整个实数域上的积分（面积）是1，概率密度函数在一点处无法测出面积，那就测在这一点处微分邻域的面积，来代表这一点处的面积。

2.连续型随机变量的概率密度函数研究的是在数轴上每个点的地方取值（一个取值对应某个事件的映射）可能性大小的问题。

3.可以和离散型随机变量的概率取值进行对比。

4.概率密度函数，以函数值的不同定义数轴上某个位置取值大小，取值大，就意味着事件发生的概率大，取值小，就意味着事件发生的概率小。

5.f(x)在非均匀质量细杆中就是密度函数。

注解：

1.为什么f(x)整个实数区间的积分是1，因为是概率，所有概率加起来取值是1.

注解：

1.利用离散型随机变量的概率分布律和连续型随机变量密度函数的这4个特点，建立方程，反求未知参数。

【期末不挂概率论】分布函数密度函数到底是个啥？_哔哩哔哩_bilibili

以下雨为例子，1到6点期间每一秒下雨的可能性是等可能的，那3点~5点下雨的概率就是(5-3)/(6-0)=2/6=1/3.也是下面的面积的比值（阴影部分的面积/整个矩形的面积）：

但是有的事件的发生不是等可能的，如：

此时，求发生在某一区间的事件的概率的时候，还是要用面积的比值，就是阴影部分的面积/整个面积，整个的面积=1，阴影部分的面积要用积分进行求取，那既然要用积分，就必须定义一个函数，这个定义的函数f(x)就是概率密度函数。

也叫做累积分布函数或者渐进分布函数。

小结：发生在某一区间段内的事情的概率就是概率密度函数在那个区间的积分。

参考１：

分布函数就是变量小于等于某个特定值a的概率（或者频率，如果是用数据统计出来的话），也即 $F(a)=P\{X \le a\}$ 。

还不好理解？
假设现在有全世界所有人的身高的分布函数，而你的身高是175cm，那么分布函数在175cm处的取值就是所有比你矮或者和你一样高的人占全世界所有人的比例。姚明的身高是226cm，那么分布函数在226cm处的取值就是所有比姚明矮或者和姚明一样高的人占全世界所有人的比例（https://www.zhihu.com/question/26298175/answer/60140036）。

都是翻译的锅,Cumulative Distribution Function, 简称CDF.直接翻译为渐增分布函数不就好了

参考２：

离散型随机变量的概率函数、概率分布、分布函数

① 概率函数

概率函数，顾名思义，用函数的形式来表达概率：

$p_{i} = P(\text {X}=a_{i})$ ，其中： $i=1，2，3，4，5，6$
其中自变量 $\text {X}$ 是随机变量的取值，因变量 $p_{i}$ 是自变量取相应值的概率，所以顺理成章就称为自变量 $\text {X}$ 的概率函数，从上面式子可算出，概率函数一次只能一个取值的概率，比如 $P(\text{X}=1)= \frac{1}{6}$ ，表示当自变量 $\text{X}=1$ 时的概率为 $\frac{1}{6}$ .

② 概率分布

概率分布，顾名思义，就是概率的分布，还是讲的"概率"，不过侧重点在于"分布"，为便于理解，我们来看一张图：

在很多书中，上面的列表叫做离散型随机变量的 "概率分布"，其实严格意义来说，应该叫做"离散型随机变量的值分布和概率分布". 名字虽长了一点，但有利于我们更好的理解.

注：上面的列表，需要列出自变量所有可能的取值及对应的概率.

举例：一颗具有6面的骰子，每一个面对应的数字为1，2，3，4，5，6，随机摇骰子，每一个数字出现的概率都为 1/6，你说下面的列表是骰子取值的概率分布吗？

分析：上面是骰子的取值，下面是取值所对应的概率，看起来，好像就是概率分布啊，其实大错特错，骰子的取值要包括：所有可能的取值，上面的取值漏掉了 6 .

③ 分布函数

分布函数又是个什么东东，其实它的全名叫做：概率分布函数.

我们来讲一下它的定义：

设离散型随机变量的分布律是： $p_{k} = P(X=x_{k})，k=1，2，3，...$
则 $F(x)=P(\text{X} \leqslant x) =\sum_{x_{k} \leqslant x} p_{k}$ ，由于 $X$ 是取 $\leqslant x$ 的诸值 $x_{k}$ 的概率之和，
故又称是 累积概率函数.

其实上面定义所讲的"分布律"就是我们前面所说的 "概率函数"

如果你仔细推敲 "概率分布函数" 的定义，就会发现它就是概率函数中的概率累加的结果，所以它又叫做"累积概率函数".

概率函数与概率分布函数其实就是一个硬币的两面，只是用不同的方式来描述概率.

3.连续型随机变量的概率函数与分布函数

① 概率函数

其实连续型随机变量的概率函数换了一个名字，叫做 "概率密度函数".

为啥要换名字呢，其实我们仔细一想就能大致明白，连续型随机变量的数值是连续的，求它的概率是有"问题"的，就像一个物体，你要计算它每个点所对应的"质量".

下面我们来看一下，陈希孺老师所著的《概率论与数理统计》对密度函数的描述:

"密度函数"这名字由来可解释如下.

取定一个点 $x$ ，则按分布函数的定义，事件 $x < \text{X} < x + h$ ( $h$ 为常数)的概率就为：
$F(x + h) - F(x)$ ，所以比值： $[F(x + h) - F(x)] / h$ ，可以解释为 $x$ 点附近
$h$ 这么长的区间 $(x, x + h)$ 内，单位长度所占有的概率. 令 $h \rightarrow 0$ ，则这个比的极限，即 $F^{'}(x) = f(x)$ ，也就是 $x$ 点处(无穷小的区段内)单位长的概率，或者说，它反映了概率在 $x$ 点处"密集程度". 你可以设想一根极细的无穷长的金属杆，总质量为1，概率密度相当于杆上各点的质量密度.

可能说到这里，大家还是有点懵，继续往下看：

　　　　　　　　　　　图5 分布函数与概率密度函数

$F(b) - F(a) = \int_{a}^{b} f(x)dx \tag{1}$

分析：概率密度函数其实一个定积分的函数，定积分在数学一般用来求面积，在这里你把"概率"理解为"面积"即可.

下面回答一些常见问题：

Q: 概率密度函数在某点的函数值，有什么意义？

A: 其实 概率密度函数值 即为概率在该点的变化率.

千万不要误认为：概率密度函数值是该点的概率.

举例：速度(概率密度)和距离(概率)

某一点的速度不能认为是某一点的距离，这样是没有意义的.

因为距离是从XX到XX的概念，所以概率也要有区间.

这个区间可以是 $x$ 的邻域，对 $x$ 的邻域 $f(x)$ 进行积分，可以求得这个邻域的面积，这个面积大小就代表了事件在该邻域所发生的概率大小.

参考：

如何简单理解概率分布函数和概率密度函数？_anshuai_aw1的博客-CSDN博客blog.csdn.net

作者：0704
链接：https://zhuanlan.zhihu.com/p/266435689
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

参考３：

概率分布有两个词组成，概率+分布。

概率指的是一些数据出现的可能性。

分布指的是数据的稀疏和稠密。

分布：数据在统计图中的分布。

概率分布：将随机变量，概率，分布组合一起的手段。用统计图表示随机变量可能出现的结果发生的概率。横轴是随机变量的数字，是随机事件的所用可能结果，纵轴是横轴上某个随机事件发生的概率。

概率分布是用统计图来表示随机变量所有可能结果和对应结果发生的概率。

概率分布就是在统计图中表示概率，横轴是数据的值，纵轴是横轴上对应数据值的概率。

离散型概率分布 ,要求把所有可能出现的情况全部都列出来，少一个都不行

很显然的，根据数据类型的不同，概率分布分为两种：离散概率分布，连续概率分布。

那么，问题就来了。为什么你要关心数据类型呢？

因为数据类型会影响求概率的方法。

对于离散概率分布，我们关心的是取得一个特定数值的概率。例如抛硬币正面向上的概率为:p(x=正面)=1/2

而对于连续概率分布来说，我们无法给出每一个数值的概率，因为我们不可能列举每一个精确数值。

例如，你在咖啡馆约妹子出来，你提前到了。为了给妹子留下好印象，你估计妹子会在5分钟之内出现，有可能是在4分钟10秒以后出现，或者在4分钟10.5秒以后出现，你不可能数清楚所有的可能时间，你更关心的是在妹子出现前的1-5分钟内（范围），你把发型重新整理下（虽然你因为加班头发已经秃顶了，但是发型不能乱），给妹子留个好印象。所以，对于像时间这样的连续型数据，你更关心的是一个特定范围的概率是多少。

接下里，我们一起来聊聊常见的4种概率分布。

1）3种离散概率分布

二项分布泊松分布几何分布

2）1种连续概率分布

正态分布

第1种：二项分布

什么是二项分布呢？只要符合下面3个特点就可以判断某事件是二项分布了：

1）做某件事的次数（也叫试验次数）是固定的，用n表示。

（例如抛硬币3次，投资5支股票），

2）每一次事件都有两个可能的结果（成功，或者失败）

（例如每一次抛硬币有2个结果：正面表示成功，反面表示失败。

每一次投资美股有2个结果：投资成功，投资失败）。

3）每一次成功的概率都是相等的，成功的概率用p表示

（例如每一次抛硬币正面朝上的概率都是1/2。

你投资了5家公司的股票，假设每一家投资盈利成功的概率都相同）

4）你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。

（你已经知道了我前面讲的5家美股的赚钱概率最大，所以你买了这5家公司的股票，假设投资的这5家公司成功的概率都相同，那么你关心其中只要有3个投资成功，你就可以赚翻了，所以想知道成功3次的概率）

3. 二项分布如何计算概率？

怎么计算符合二项分布事件的概率呢？也就是你想知道下面的问题：

你抛硬币3次，2次正面朝上的概率是多少？ 你买了这5家公司的股票，3支股票赚钱的概率是多大？

上面我们已经知道了二项分布的4个特点，并知道每个特点的表示方法：

1）做某件事次数是固定的，用n表示
2）每一次事件都有两个可能的结果（成功，或者失败）
3）每一次成功的概率都是相等的，成功的概率用p表示
4）你感兴趣的是成功x次的概率是多少

这时候，二项分布的公式就可以发挥威力了：

这里你也别害怕数学公式，每一项的含义我前面已经讲的很清楚了。这个公式就是计算做某件事情n次，成功x次的概率的。很多数据分析工具（Excel，Python，R）都提供工具让你带入你研究问题的数值，就能得到结果。

例如，抛硬币5次（n），恰巧有3次正面朝上(x=3，抛硬币正面朝上概率p=1/2)，可以用上面的公式计算出出概率为31.25%（用Excel的BINOM.DIST函数，Python，R都可以快速计算)

第2种：几何分布

其实我一直把几何分布，叫做二项分布的孪生兄弟，因为他两太像了。只有1点不同

我们还是从下面这个套路聊起来一起找出这个不同的“劲爆点”：

1 . 几何分布有啥用？ 2. 如何判断是不是几何分布？ 3. 几何分布如何计算概率？

1.几何分布有啥用？

如果你需要知道尝试多次能取得第一次成功的概率，则需要几何分布。

2. 如何判断是不是几何分布？

只要符合下面4个特点就可以判别你做的事情是就是几何分布了：

1）做某事件次数（也叫试验次数）是固定的，用n表示
（例如抛硬币3次，表白5次），
2）每一次事件都有两个可能的结果（成功，或者失败）
（例如每一次抛硬币有2个结果：正面表示成功，反面表示失败。
每一次表白有2个结果：表白成功，表白失败）。
3）每一次“成功”的概率都是相等的，成功的概率用p表示
（例如每一次抛硬币正面朝上的概率都是1/2。
假设你是初出茅庐的小伙子，还不是老油条，所以你表白每一次成功的概率是一样的）
4）你感兴趣的是，进行x次尝试这个事情，取得第1次成功的概率是多大。
（例如你在玩抛硬币的游戏，想知道抛5次硬币，只有第5次（就是滴1次成功）正面朝上的概率是多大。

你表白你的暗恋对象，你希望知道要表白3次，心仪对象答应和你手牵手的概率多大。）

正如你上面看到的，几何分布和二项分布只有第4点，也就是解决问题目的不同。这个点够不够劲爆？（嘻嘻）

第3种泊松分布

还是同样的味道，还是同样的讨论，我们一起通过下面3个问题了解这个泊松分布。

1. 泊松分布有啥用？ 2. 如何判断是不是泊松分布？ 3. 泊松分布如何计算概率？

1. 泊松分布有啥用？

如果你想知道某个时间范围内，发生某件事情x次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数，一个月内某机器损坏的次数等。

知道这些事情的概率有啥用呢？

当然是根据概率的大小来做出决策了。比如你搞了个抽奖活动，最后算出来一天内中奖10次的概率都超过了90%，然后你顺便算了下期望，再和你的活动成本比一下，发现要赔不少钱。那这个活动就别搞了。

泊松分布的形状会随着平均值的不同而有所变化，无论是一周内多少人能赢得彩票，还是每分钟有多少人会打电话到呼叫中心，泊松分布都可以告诉我们它们的概率。

作者：猴子
链接：https://zhuanlan.zhihu.com/p/28309212
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

posted on 2020-06-29 16:39 一杯明月阅读(5144) 评论(0) 收藏举报