【统计学】5.概率与概率分布
【统计学】5.概率与概率分布
什么是概率?
一般而言,概率是0-1之间的一个数,告诉我们一个事件发生的经常性
5.1 随机时间及其概率
5.2 离散性随机变量及其分布
5.3 连续型随机变量的概率分布
学习目标
1.了解随机时间及其概率
2.解释随机变量及其分布
3.计算随机变量的数学期望和方差
4.计算离散型随机变量的概率和概率分布
5.计算连续型随机变量的概率
6.用excel计算分布的概率
5.1 随机事件及其概率
5.1.1 随机事件的几个基本概念
试验(experiment)
- 在相同条件下,对事物或现象所进行的观察
- 例如:掷一枚骰子,观察其出现的点数
试验的特点
- 可以在相同的条件下重复进行
- 每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的
- 在试验结束之前,不能确定该次试验的确切结果
事件的概念
- 事件(event):随机试验的每一个可能结果(任何样本点集合)
- 例如:掷一枚骰子出现的点数为3
- 随机事件(random event):每次试验可能出现也可能不出现的事件
- 例如:掷一枚骰子可能出现的点数
- 必然事件(certain event):每次试验一定出现的事件,用
\[\Omega \] 1.例如:掷一枚骰子出现的点数小于7
4.不可能事件(impossible event):每次试验一定不出现的事件,用
\[\Phi \]1.例如掷一枚骰子出现的点数大于6
事件与样本空间
基本事件(elementary event)
- 一个不可能再分的随机事件
- 例如:掷一枚骰子出现的点数
样本空间(sample space)
一个试验中所有基本事件的集合,用
\[\Omega \]例如:在掷一枚骰子的试验中
\[\Omega = \lbrace 1,2,3,4,5,6 \rbrace \]
- 在投掷硬币试验中
\[\Omega = \lbrace 正面,反面\rbrace \]
5.1.2 事件的概率
事件的概率(probability)
- 事件A的概率是对事件A在试验中出现的可能性大小的一种度量
- 表示事件A出现可能性大小的数值
- 事件A的概率表示为P(A)
- 概率的定义有:古典定义、统计定义和主观概率定义
概率的古典定义
如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间所包含的基本事件个数n的比值
\[P(A) = \frac{事件A所包含的基本事件个数}{样本空间所包含的基本事件个数} = \frac{m}{n} \]概率的统计定义
在相同条件下进行n次试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为
\[P(A) = \frac{m}{n} = p \]主观概率定义
- 对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定
- 概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生的可能性的判断
5.1.3 关于概率计算的几个例子
5.2 离散型随机变量及其分布
5.2.1 随机变量的概念
随机变量(random variables)
- 一次试验的结果的数值性描述
- 一般用X、Y、Z来表示
- 例如:投掷两枚硬币出现正面的数量
- 根据取值情况的不同分为离散型随机变量和连续型随机变量
离散型随机变量(discrete random variables)
1.随机变量X去有限个值或所有取值都可以逐个列举出来
\[X_1,X_2,... \]2.以确定的概率取这些不同的值
3.离散型随机变量的一些例子
试验 随机变量 可能的取值 抽查100个产品 取到次品的个数 0,1,2,...,100 一家餐馆营业一天 顾客数 0,1,2,... 电脑公司一个月的销售 销售量 0,1,2,... 销售一辆汽车 顾客性别 男性为0;女性为1 连续型随机变量(continuous random variables)
- 随机变量X取无限个值
- 所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点
- 连续型随机变量的一些例子
试验 随机变量 可能的取值 抽查一批电子元件 使用寿命(小时) X>=0 新建一座住宅楼 半年后工程完成的百分比 [0,100] 测量一个产品的长度 测量误差(cm) X>=0
5.2.2 离散型随机变量的概率分布
列出离散型随机变量X的所有可能取值
列出随机变量取这些值的概率
通常用下面的表格表示
\[\begin{array}{cc} \mathrm{X = x_i} & \mathrm{x_1,x_2,...,x_n} \\ \hline \\ P(X=x_i)=p_i & p_1,p_2,...p_n \\ \end{array} \]
\[P(X = x_i) = p_i \]称为离散型随机变量的概率函数
\[p>=0 \\ \sum^n_{i=1}p_i =1 \]离散型随机变量的概率分布形式(0-1分布)
- 一个离散型随机变量X只取两个可能的值
- 例如,男性用1表示,女性用0表示,合格品用1表示,不合格用0表示
- 列出随机变量取这两个值的概率
离散型随机变量的概率分布(均匀分布)
- 一个离散型随机变量取各个值得概率相同
- 列出随机变量取值及其取值的概率
- 例如,投掷一枚骰子,出现的点数及其出现各点的概率
离散型随机变量的期望值和方差
离散型随机变量的期望值(expected value)
- 在离散型随机变量X的一切可能取值的完备组中,各可能取值x_i与其取对应的概率p_i乘积之和
- 描述离散型随机变量取值的集中程度
- 计算公式为
\[E(X) = \sum^n_{i=1}x_ip_i (X取有限个值)\\ E(X) = \sum^n_{i=1}x_ip_i (X取无穷个值) \]离散型随机变量的方差(variance)
- 随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)
- 描述随机变量取值的分散程度
- 计算公式为
\[D(X) = E[X-E(X)]^2 \\ 若X是离散型随机变量,则\\ D(X) = \sum^\infty_{i=1}[x_i-E(X)]^2 \cdot p_i \]离散系数:可用来比较不同期望值得总体之间的离中趋势
几种常见的离散型概率分布
二项分布(贝努利试验)
- 二项分布与贝努利试验有关
- 贝努利试验具有如下属性
- 试验包含了n个相同的试验
- 每次试验只有两个可能的结果,即“成功”和“失败”
- 出现“成功”的概率p对每次试验结果是相同的,“失败”的概率q也相同,且p+q=1
- 试验是相互独立的
- 试验“成功”或“失败”可以计数
二项分布(Binomial distribution)
- 进行n次重复试验,出现“成功”的次数的概率分布称为二项分布
- 设X为n次重复试验中事件A出现的次数,X取x的概率为
\[P \lbrace X = x\rbrace = C^x_np^xq^{n-x} (x = 0,1,2,..,n) \\ 式中:C^x_n = \frac{n!}{x!(n-x)!} \]二项分布的性质
- 显然,对于
\[P \lbrace X=x \geq0 \rbrace,x=1,2,...,n\\ \sum^n_{x=0}C^x_np^xq^{n-x} = (p+q)^n = 1 \]
- 同样有
\[P\lbrace 0 \leq X \leq m \rbrace = \sum^m_{x=0}C^x_np^xq^{n-x} \\ P \lbrace m \leq X \leq n \rbrace = \sum^n_{x=m}C^x_np^xq^{n-x} \]
- 当n=1时,二项分布化简为
\[P \lbrace X = x\rbrace = p^xq^{1-x} x=0,1 \]二项分布的数学期望和方差
二项分布的数学期望为
\[E(X) = np \]方差为
\[D(X) = npq \]珀松分布(Poisson distribution)
- 用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布
- 珀松分布的例子
- 一个城市在一个月内发生交通事故次数
- 消费者协会一个星期内收到的消费者投诉次数
- 人寿保险每天收到的死亡声明的人数
珀松概率分布函数
\[P \lbrace X=x \rbrace = \frac{\lambda e^{-\lambda}}{x!} (x=0,1,2,...,n) \]\[\lambda:给定的时间间隔、长度、面积、体积内"成功"的平均数\\ e = 2.71828 \\ x:给定的时间间隔、长度、面积、体积内"成功"的次数 \]珀松分布的数学期望和方差
1.珀松分布的数学期望
\[E(X) = \lambda \]2.方差为
\[D(X) = \lambda \]
珀松分布(作为二项分布的近似)
- 当试验的次数n很大,成功的概率p很小时,可用珀松分布来近似计算二项分布的概率,即
- 实际应用中,当
\[P \leq0.25 ,n>20 ,np \leq5 \]近似效果良好
5.3连续型随机变量的概率分布
连续型随机变量的概率分布
- 连续型随机变量可以取某一区间或整个实数轴上的任意一个值
- 它取任何一个特定的值得概率都等于0
- 不能列出每一个值及其相应的概率
- 通常研究它取某一区间值的概率
- 用数学函数的形式和分布函数的形式来描述
5.3.1 概率目的与分布函数
概率密度函数(probability density function)
- 设X为一连续型随机变量x,x为任意实数,X的概率密度函数记为f(x),它满足条件
\[(1)f(x) \geq 0 \\ (2)\int ^{+\infty}_{-\infty} f(x)dx = 1 \]
- f(x)不是概率
在平面直角坐标系中画出f(x)的图形,则对于任何实数
\[x_1<x_2,P(x<x\leq x_2) \]是该曲线下从x_1到x_2的面积
\[P(a<X\leq b) = \int^b_a f(x)dx \]
分布函数(distribution function)
- 连续型随机变量的概率也可以用分布函数F(x)来表示
- 分布函数定义为
\[F(x) = P(X \leq x) = \int^x_{-\infty}f(t)dt \\ (-\infty<x<+\infty) \]
- 根据分布函数,
\[P(a<X<b) \]可以写为
\[P(a<X<b) = \int^b_a f(x)dx = F(b)- F(a) \]分布函数与密度函数的图示
- 密度函数曲线下的面积等于1
- 分布函数是曲线下小于x的面积
连续型随机变量的数学期望和方差
- 连续型随机变量的数学期望为
\[E(x) = \int^{+\infty}_{-\infty}xf(x)dx = \mu \]
- 方差为
\[D(X) = \int^{+\infty}_{-\infty}[x-E(X)]f(x)dx = \sigma^2 \]
5.3.2 正态分布
正态分布(normal distribution)
- 描述连续型随机变量的最重要的分布
- 可用于近似离散型随机变量的分布
- 例如:二项分布
- 经典统计推断的基础
概率密度函数
\[f(x) = \frac{1}{\sigma \sqrt{2 \pi}}e^{-\frac{1}{2 \sigma^2}(x-\mu)^2} \\ -\infty<x<+\infty \]\[f(x) = 随机变量X的频数\\ \sigma^2 = 总体方差\\ \pi = 3.14159;e = 2.71828\\ x = 随机变量的取值(-\infty<x<+\infty)\\ \mu = 总体均值 \]正态分布的性质
- 概率密度函数在x的上方,即f(x)>0
- 正态曲线的最高点在均值μ,它也是分布的中位数和众数
- 正态分布是一个分布族,每一特定正态分布通过均值μ和标准差sigma来区分。μ决定了图形的中心位置,sigma决定曲线的平缓程度,即宽度
- 曲线f(x)相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交
- 正态曲线下的总面积等于1
- 随机变量的概率由曲线下的面积给出
- 概率是曲线下的面积
标准正态分布
一般的正态分布取决于均值μ和标准差sigma
计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的
若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表
- 任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布
\[Z = \frac{X-\mu}{\sigma} \backsim N(0,1) \]
- 标准正态分布的概率密度函数
\[\phi(x) = \frac{1}{2\pi}e^{-\frac{x^2}{2}}\\ -\infty<x<+\infty \]
- 标准正态分布的分布函数
\[\Phi(x) = \int^x_{-\infty}\phi(t)dt = \int^x_{-\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt \]
标准正态分布表的使用
- 将一个一般的转换为标准正态分布
- 计算概率时,查标准正态概率分布表
- 对于负的x,可由
\[\phi(-x) = 1-\phi(x) \]得到
对于标准正态分布,即
\[X \backsim N(0,1) \]\[P(a\leq X \leq b) = \phi(b)-\phi(a)\\ P(|X| \leq a) = 2\phi(a)-1 \]对于一般的正态分布,即
\[X \backsim N(\mu,\sigma^2) \]\[P(a \leq X \leq b) = \phi(\frac{b-\mu}{\sigma}) - \phi(\frac{a-\mu}{\sigma}) \]
posted on 2021-05-10 15:50 pandaboy1123 阅读(662) 评论(0) 编辑 收藏 举报