概率论与数理统计
概率论与数理统计
第一章,概率论的基本概念
1.1 随机事件
频率是随机变量
频率与概率的关系:
频率在一定程度上反映了事件发生可能性的大小,尽管每进行一次试验,所得到的频率各不相同,但只要重复试验的次数足够多,频率与概率会非常接近.
频率与试验次数有关,概率与试验次数无关,它是一个理论值.
实际中,当概率不易求出时,人们常通过做大量重复试验,用事件出现的频率去估计概率.
- 频率具有稳定性
- 频率具有确定性
1.1.3 事件间的关系
把无限循环小数写成分数形式。
有理数均可以排,均可以写成分数形式
互不相容和对立事件
联系与区别
ABC 试验的随机事件
至少要想到和事件。
至多要么就是反面,要么想到积事件。
抽查产品,不放回,三次,A1,A2,A3,第 1,2,3 次取合格品
射击打 3 枪,Ai ,i = 1,2,3,第 i 次击中.
像这种第几次的题目,第几次击中,第几次及格的题目,一个主要的点,
都可以用 A1,A2,A3,这样子去以示区别。
1.2 事件的概率
1.2.1 概率的基本描述
1.2.2 古典概率模型
组合
排列
古典概型的例题
一套 ⑤ 卷的选集,放书架上,求自左向右或自右向左是 1,2,3,4,5 的概率;邮筒,信
球球问题
多解法,第 m 次取出是白球(不放回)
法 1 是,分母全排列坐好,也就是(a+b)!,分子也就是第 m 个位置是白球,其实就是先从 a 个白球当中选出一个,剩下的位置球球们全排列,即(a+b-1)!
法 2 是,最开始就假设是 m 个位置,分母就是从 a+b 个球当中选择 m 个球球排成一排,相当于入座。分子就是先从 a 个白球当中拿 1 个白球放到第 m 个位置上,剩下 m-1 个位置给剩下的(a+b-1)的球球们去排列。
法 3 是,假设这 m 个位置已经坐满了了人,我们可以假设第 m 个位置是最先坐的,其他的不用管,那么概率就是,第 m 个位置是白球的概率,也就是 a/(a+b)
法 4 是,和法 3 是一个道理,只是把场景具象化了
古典性质
几何概型和例题
等来等去见面问题
投针问题,问针和任意平行线相交的概率
对面积求定积分就是概率啦。
计算过程,注意,每一步都认真写,不能跳步。
几何概型
频率与概率
做大量实验以后,频率接近概率。
公理化 (不需要证明)
推出来的有限可加性是重点,就,互不相容可以直接加
几个性质
加法公式,2 个事件,3 个事件,4 个事件....有个规律。
(加法公式、和事件公式)三个和事件科普:先 A+B+C。就是大重叠部分被加了 2 次。而三重叠部分被加了 3 次。所以剪掉所有的双重叠(这同时也把三重叠的三次给减掉了,所以要加回来)
总结:先加然后减...+-+-+...
概率等于 0 的,也有可能发生。
事情复杂的时候想逆事件。
不需要排列的都是组合。
分步则乘法,不同种类则加法。
生日问题
好神奇,因为如果当 n 大于 55 则,生日相同的概率有 0.99...
1.4 条件概率
插入对条件概率的理解:
最开始我们是无条件概率,样本空间是全集。
当进入条件概率的时候,样本空间就发生了改变,变成了条件。
理解方法 1,按照数量理解,也就是文字游戏。
分母是条件样本空间也就是所有的 B,
分子是 A 与 B 的交集,相当于再 B 的样本空间里 A 发生的一部分。
所以是 nAB/nB
理解方法 2:按照概率理解。
整个条件样本空间的概率就是 B 发生的概率
分子就是 AB 同时发生的概率。
所以是
P(AB)/P(B)
有关例题(有点小坑):
有关性质:
乘法公式
这个也是积事件公式,可以通过条件概率把概率解出来。(上边有和事件公式)
证明:
合格品问题(关于第几次取到合格品)
甲乙两厂灯泡合格
抽签问题
转化分步乘法更简单:
传染病例题(球球)
全概率公式
三个 B 与 Ai事件的交集相加,就是 B 事件全集
全概率公式:把要求的事件分为几部分,挨个去求。
全概率公式麻烦点的情况,用 2 次。一个是关于次品概率,一个关于通过验证概率。
贝叶斯公式
已经知道结果了,倒过来找原因
例 1
- 已经知道是产品不合格,求是哪个产品不合格的概率最大。
有两种情况加上检验的情况下。要分成原本的一批,检验的为一批
贝叶斯公式很适用于要用到乘法公式/条件概率的情况。
原理:
事件独立性
独立性与证明
独立性与互不相容性区别
独立性质的使用场景
独立与互不相容例题
经典独立投篮
破译密码题(99%逆事件启发)
伯努利模型
二项概率公式
理解: 就是原本的(a+b)n 它只有一个 an,因为括号相乘,相当于每个括号选一个。接着就是,an-1,这个它其实就相当于在 n 个括号里挑选 n-1 个 a 相乘,对应的 b 就只有一个。(因为 b 在剩下那一个括号里取)以此类推
例题
1,大量产品,废品率。2,彩票
第二章,随机变量及其分布
随机变量的概念
离散型随机变量及其概率分布
上图下边的是概率图
(分布表,分布列的验证,加起来等于 1)
连续型随机变量及其概率密度函数
频率密度直方图特点
当组距很小的时候,这个频率密度直方图,上就会显示一条光滑曲线。这个曲线对应的函数就是概率分布密度函数
密度函数和 x 轴的围成的面积就是概率
概率密度函数定义。那个原函数
概率密度定义:
对于随机变量 X 的分布函数 F(x),如果存在非负可积函数 f(x),使得对任意实数 x,有
则 X 为连续型随机变量,称 f(x)为 X 的概率密度函数,简称为概率密度。
这里其实说明,概率密度函数,其实是,连续型随机变量的的分布函数里的那个小 f(x)
单纯的讲概率密度没有实际的意义,它必须有确定的有界区间为前提。可以把概率密度看成是纵坐标,区间看成是横坐标,概率密度对区间的积分就是面积,而这个面积就是事件在这个区间发生的概率,所有面积的和为 1。所以单独分析一个点的概率密度是没有任何意义的,它必须要有区间作为参考和对比。
概率密度函数的性质:
非负性
规范性
这两条基本性质可以用来判断一个函数是否为某一连续型随机变量的概率密度函数。
例题
分布函数
大 X 就是随机变量,小 x 是具体的变量。
这里要减去 0 其实就是减去某个具体的点!因为这样子离散型和连续性都成立!如果只有连续型,就直接可以不用管那个点。因为一个点的概率就是 0
分布函数典型例题
做题小技巧
连续型,分布函数公式
定义
t 是为了和前面的 x 区分开,
这里边的小的 f(t)就是密度函数。
连续型经典例题
已知密度函数求分布函数
已知分布函数,求参数。(就是利用那两个性质),灵活运用,可以两个结合起来。利用无限靠近。天!近似值!
0-1 分布
实验只有 2 种结果,并且实验只做一次!
二项分布的特例
几何分布
概率是 p ,写成 x~G(p)说明是几何分布
使用场景
几何分布(Geometric distribution)是离散型概率分布。其中一种定义为:在 n 次伯努利试验中,试验 k 次才得到第一次成功的机率。详细地说,是:前 k-1 次皆失败,第 k 次成功的概率。几何分布是帕斯卡分布当 r=1 时的特例。
在伯努利试验中,成功的概率为 p,若 ξ 表示出现首次成功时的试验次数,则 ξ 是离散型随机变量,它只取正整数,且有 P(ξ=k)=(1-p)的(k-1)次方乘以 p (k=1,2,…,0<p<1),此时称随机变量 ξ 服从几何分布。它的期望为 1/p,方差为(1-p)/(p 的平方)。
二项分布
n 是做几次实验。k 是在这 n 次实验当中 p 发生了几次。
泊松分布
k,代表次数。,近似于二项分布的 np
泊松分布一般的场景,电话台呼叫次数,公用设施...等车,收银台,挂号处
二项分布用泊松分布近似计算的条件。
例题
超几何分布
不放回抽样试验
继续近似
超几何分布模型的数量变得特别庞大的时候可以近似看成是符合二项分布的。忽略那些小细节,用二项分布来计算。
近似小细节(技巧)
超几何基数大,可以近似二项分布,二项分布不好算,可以近似泊松公式。(而二项分布的 np 就是泊松公式的。)
均匀分布
一些关系:
密度函数是指连续型随机变量,概率函数是指离散型随机变量,然后密度函数(就是图中的 f(t))的分布函数是它的原函数也就是,概率函数(离散)的分布函数是 F(x),是随机变量小于 x 的所有事件的概率之和。
均匀分布那个概率等于那个图片上的横线与 x 轴的面积。就是 1。
指数分布
指数分布的密度函数
指数分布一个特性:
无记忆性。就是,你灯泡用了 100 小时再用一小时,和你新灯泡再用 1 小时,概率是一样的。
无记忆性理解:
大于 60/大于 50 的比例等于大于 10/大于 0 的比例
指数分布的分布函数
例题:1000 代表灯泡正常工作 1 小时。
例题
这里用到条件概率,还有指数分布公式。然后根据分布函数求概率,可以得出总概率。
正态分布
密度函数就是
性质;(一般正正态分布)
只有相互独立的正态分布加减之后,才是正态分布。如果两个相互独立的正态分布 XN(u1,m),YN(u2,n),那么 Z=X±Y 仍然服从正太分布,Z~N(u1±u2,m+n)。
正态分布相加减规则:两个正态分布的任意线性组合仍服从正态分布,此结论可推广到 n 个正态分布。
有限个相互独立的正态随机变量的线性组合仍然服从正态分布,只有独立的正态随机变量才服从正态分布。若随机变量不相互独立,其线性组合不一定服从正态分布。
标准正态分布
查表是用这两个公式,要标准正态分布才可以查
一般正态分布如何化为标准正态分布
一般的
标准的
例题
三 SiGeMa 原则
3σ 原则为
数值分布在(μ-σ,μ+σ)中的概率为 0.6826
数值分布在(μ-2σ,μ+2σ)中的概率为 0.9544
数值分布在(μ-3σ,μ+3σ)中的概率为 0.9974
可以认为,Y 的取值几乎全部集中在(μ-3σ,μ+3σ)]区间内,超出这个范围的可能性仅占不到 0.3%。
随机变量函数的分布
离散型(有重复的得合起来,没重复的直接弄)
连续型
这里特别注意要把大写的 X 弄出来
服从相应区间上均匀分布的表示
举例正态分布,问 Y 的密度函数和分布函数。
上面的大 Y 和他新写的 Y 比较,把新写的 Y 写成最上面那个大 Y 的形式(ax+b),那 a 就变成了 x/欧米伽,b 就变成了-u/欧米伽。再带入大 N,就可以得到 N(0,1)。
例题
左边是大 F,是分布函数,这里的积分里面的一坨是概率密度函数,大 X 在哪里,就在哪里求积分
变上限积分求导:上限代进去自变量,再对上限求导,(两步相乘)
第三章 ,多维随机变量及其分布
3.1 二维随机变量
3.1.1 二维随机变量及其分布函数
联合分布
性质
右连续和一维随机变量的分布函数右连续含义一致
边缘分布
理解,切之后草帽的体积,就是边缘分布覆盖的范围
3.1.2 二维离散型的联合分布和边缘分布
联合分布
做题技巧-分布函数
边缘分布
做题技巧,表画出来
然后各行各列,一个箭头过去
求出来的边缘分布表,相加得等于 1
理解
x 的边缘分布,其实就是 y 随便取,也就是包括 y 取值的所有范围,所以才直接加起来
y 的边缘分布,其实就是 x 随便取。也就是包括 x 取值的所有范围,所以才直接加起来
联合分布和边缘分布关系
只有 xy 独立的是偶,边缘分布才可以确定联合分布
3.1.3 二维连续型的联合分布与边缘分布
要求二重积分
二重积分-扩展知识
定义
f(x,y):被积函数
:被积表达式
:面积元素
x 和 y:积分变量
D:积分区域
直角坐标系下求二重积分
极坐标系下求二重积分
比较麻烦,先空着
性质
前者,后边才绝对值,有可能有部分被抵消了
后者,全都是正的,不存在抵消
二重积分的计算-直角坐标系
做题的时候,我们习惯于,先对 y 求积分
上下限就是 x 界限。
技巧
先画出 x,y 的区域,
判断是 x 型区域还是 y 型区域
再用。
计算核心
正片
这里 c 往外提,得到 1
对 1 求二重积分,结果为区域的面积
能被大量的用于二重积分运算的知识
例题
解(1)
(2)
(3)
将密度函数,分布函数都解释清楚
边缘密度函数(由边缘分布函数求导得到)
这里再次涉及到了变上限积分求导。
上限代进去自变量,再对上限求导,(两步相乘)
例 1
解
例 2
- 属于密度函数的图(原理)
例 2
已知联合分布密度函数是这样,问,为什么如此。
解
一维变量属于均匀分布,二维变量并非属于均匀分布。
性质
3.2 条件分布
3.2.1 条件分布的定义
定义
例 1
这里得注意大 X 和和小 x 的区别
- 结合图像-分析原理
反三角函数-知识补充(图像)
- 原函数的图像和反函数的图像关于 y=x 对称
反三角函数求导
反正弦函数的求导:(arcsinx)'=1/√(1-x2);
反余弦函数的求导:(arccosx)'=-1/√(1-x2);
反正切函数的求导:(arctanx)'=1/(1+x2);
反余切函数的求导:(arccotx)'=-1/(1+x2)。
3.2.2 离散型函数的随机变量
这里对行求和就是 x1 的边缘分布,对列求和就是 x2 的边缘分布
3.2.3 连续型条件分布
定义
用联合密度比上边缘分布
例 1
接着发现这个例题的条件分布的答案,和原来那个是相等的,这就说明他们独立。不会互相影响。
例 2
- 证明过程(不懂也无所谓)
- 说到了积分中值定理(不知道有啥用)
3.2.4 随机变量的独立性
定义
二维离散型独立性
二维连续型独立性
例 1
性质-变量独立,构造的函数也独立
3.3 二维随机变量函数的分布
离散
- 0-1 分布是二项分布的特例
- 当二项分布的 n=1 时,此时的二项分布就是 0-1 分布
泊松分布-是离散型的
- 这个不太好理解,记住即可。
3.3.2 二维连续变量函数的分布
定义
例 1
卷积公式
例 2
这里讲到了一个正态分布的性质
例 3
好难啊救命
后边还有一点,但是完全听不懂,就算了吧。
第四章 随机变量的数字特征
4.1 数学期望
前置知识
-
这是奇偶函数的运算规律
- 奇函数 ± 奇函数=奇函数
偶函数 ± 偶函数=偶函数
奇函数 × 奇函数=偶函数
偶函数 × 偶函数=偶函数
奇函数 × 偶函数=奇函数 - 总结
- 对于加减法,全都一样。
- 对于乘法,同偶异奇
- 奇函数 ± 奇函数=奇函数
-
收敛与绝对收敛
- 收敛就是当 x 取无穷时,函数数列趋向于一个定值。如果一个函数数列加绝对值以后还是收敛的,那就是绝对收敛
期望的概念
4.1.1 离散型期望
概念
也就是取值*概率之和
例题
4.1.2 连续型的数学期望
定义
也是要满足绝对收敛才会有这个数学期望。
公式里可以把 x 看作取值,f(x)看作概率,这样来求期望。
例题
(1)
(2)
这里的 x 是连续型的,Y 是离散型的,所以 EY 就用离散型的做法。
4.1.3 随机变量函数的期望
其实就是,原来有个随机变量,你把这个随机变量构造成新的函数,求这个函数的期望。
定义和公式
对于一维变量
例题
(1)离散型
做题的时候直接写框框的公式就行了
关键点是:把要求的表达式写出来,然后把 x 带进去得到的就是表达式的取值再乘相应的概率即可。
- 这里是把 E 后边的整个括号都看为一个整体 X 的变形,也就是原来是 X,变化为(X-1.2)2
(2)连续型
(3)结合现实的收益题
这里的给自己设置 y 变量,并且算出来 g(x)的表达式。
然后再结合 f(x)来算。比较综合。
-
关于为什么会得到 3500(y)
因为想要挣钱最多,那么关于收益的二次函数,函数图像就取最大。这个时候
开口向下,对称轴对应的 y 值就是能取到最多收益的均值了
- 此时对称轴对应的就是 b/(-2a),也就是 3500
对于二维变量
定义
- 离散型
同样是函数(本题中 z=x2 - Y)的取值 x 概率(表达式)乘概率
-
连续型
这里的 xy 就是表达式嘛。很好理解的
类似于这个
例题
(1) 和前面综合题差不多的二维题
4.1.4 数学期望的性质
- 常数的期望还是常数,因为期望是均值的概念,所以一堆常数,得到的均值就还是常数咯。然后在定义上来证明就是 c*1=c。(c 代表常数,1 代表概率)
- 右边的式子是左边的证明过程,其中,这坨东西也就是概率密度,他的值就是 1 呀。
性质五的证明与推论(任何时候都成立)
性质 6,只有独立的时候才成立
解题技巧。
如果做题的时候,发现能用性质,那就一定要用性质。
- 例题
(1)
(2)
(3)
(4)
- 在求期望的时候,尽量朝性质上靠,会更简单。
4.1.5 条件期望
4.2.1 方差
- 定义
方差等于变量平方的期望-期望的平方。
证明:
- 例题
(1)
(2)
(3)
用线性代数的方法求,画出行简化阶梯型,可以算出来。
4.2.2 方差的性质
- 方差的六条性质
- 方差性质和期望性质对比
- 标准化概念
证明
4.3.1 常见离散型的期望与方差
0-1 分布的期望和方差
- 期望
- 方差
DX=pq
二项分布的期望和方差
用 0-1 分布解释二项分布的事情
- 期望
- 方差
几何分布的期望和方差
- 期望
EX=1/p
- 方差
泊松分布的期望和方差
- 泊松分布
- 期望与方差
4.3.2 常见连续型的期望与方差
均匀分布
- 期望
- EX=
- 方差
- DX=EX2 - (EX)2 =
指数分布
- 期望
- EX=
- 方差
- DX=
正态分布
推导一般正态分布的期望和方差(这里的 EY 就是标准正态分布的期望)
- 一般正态分布
EX=μ
DX=
- 标准正态分布
EX=0
DY=1
各种分布的期望与方差小结
4.4.1 协方差
例题
(1) 离散型,求协方差,并且判断是否独立
ps:对于离散型的期望,就是取值 x 对应的概率
解答:
对于离散型判断是否独立很简单,直接就是,两个边角的数对应下去,看是否乘积相等,只要有一个不想等就是不独立。
而对于连续型来说,就是求出两个边缘分布函数,然后乘起来看看是否等于联合分布的函数。
(2) 求协方差
协方差性质
这个可以推导出,相关系数(不受到计量单位影响)
4.4.2 相关系数
重点:相关系数的取值在[-1,1]
性质
>0 则为正相关!<0 时负相关
只有二维正态分布,独立和不相关是等价的。
4.5 中心距与原点矩
第五章
5.1 大数定律
5.1.1 切比雪夫不等式
用的时候
例题
(1) 求落在里头的概率
(2)
5.1.2 切比雪夫大数定律
- 引导:
- 定律:
理解:变量的均值收敛与期望的均值
- 推论
辛钦大数定理
伯努利大数定律
5.2 中心极限定理
这里的中心毫无意义
理解:大量独立同分布的变量的和标准化以后就是标准正态分布。
例题:
(1)
(2)求 100 次射击里,环数落于 915 到 945 的概率
解答
棣莫弗—拉普拉斯(De Moivre-Laplace)定理
例题
(1)
如果要求等于就是这个
(2)这里把题目的 3 改成 5
- 二项分布的近似(np 适中大概就是 np<=10)
一般用正态分布近似的条件都是 n 成千上万+++
李雅普诺夫(Lyapunov)定理
待上传...
版权
作者是 Lovi 呀。