CSS Ribbon

Reproducing the GitHub Ribbon in CSS

【统计学】5.概率与概率分布

【统计学】5.概率与概率分布

什么是概率?

一般而言,概率是0-1之间的一个数,告诉我们一个事件发生的经常性

5.1 随机时间及其概率
5.2 离散性随机变量及其分布
5.3 连续型随机变量的概率分布

学习目标

1.了解随机时间及其概率
2.解释随机变量及其分布
3.计算随机变量的数学期望和方差
4.计算离散型随机变量的概率和概率分布
5.计算连续型随机变量的概率
6.用excel计算分布的概率

5.1 随机事件及其概率

5.1.1 随机事件的几个基本概念

试验(experiment)

  1. 在相同条件下,对事物或现象所进行的观察
    1. 例如:掷一枚骰子,观察其出现的点数

试验的特点

  1. 可以在相同的条件下重复进行
  2. 每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的
  3. 在试验结束之前,不能确定该次试验的确切结果

事件的概念

  1. 事件(event):随机试验的每一个可能结果(任何样本点集合)
    1. 例如:掷一枚骰子出现的点数为3
  2. 随机事件(random event):每次试验可能出现也可能不出现的事件
    1. 例如:掷一枚骰子可能出现的点数
  3. 必然事件(certain event):每次试验一定出现的事件,用

Ω

​ 1.例如:掷一枚骰子出现的点数小于7

​ 4.不可能事件(impossible event):每次试验一定不出现的事件,用

Φ

  	1.例如掷一枚骰子出现的点数大于6

事件与样本空间

  1. 基本事件(elementary event)

    1. 一个不可能再分的随机事件
    2. 例如:掷一枚骰子出现的点数
  2. 样本空间(sample space)

    1. 一个试验中所有基本事件的集合,用

      Ω

    2. 例如:在掷一枚骰子的试验中

    Ω={1,2,3,4,5,6}

    1. 在投掷硬币试验中

      Ω={}

5.1.2 事件的概率

事件的概率(probability)

  1. 事件A的概率是对事件A在试验中出现的可能性大小的一种度量
  2. 表示事件A出现可能性大小的数值
  3. 事件A的概率表示为P(A)
  4. 概率的定义有:古典定义、统计定义和主观概率定义

概率的古典定义

如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间所包含的基本事件个数n的比值

P(A)=A=mn

概率的统计定义

在相同条件下进行n次试验,事件A出现m次,则比值m/n称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即为事件A的概率,记为

P(A)=mn=p

主观概率定义

  1. 对一些无法重复的试验,确定其结果的概率只能根据以往的经验人为确定
  2. 概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生的可能性的判断
5.1.3 关于概率计算的几个例子

5.2 离散型随机变量及其分布

5.2.1 随机变量的概念

随机变量(random variables)

  1. 一次试验的结果的数值性描述
  2. 一般用X、Y、Z来表示
  3. 例如:投掷两枚硬币出现正面的数量
  4. 根据取值情况的不同分为离散型随机变量和连续型随机变量

离散型随机变量(discrete random variables)

1.随机变量X去有限个值或所有取值都可以逐个列举出来

X1,X2,...

2.以确定的概率取这些不同的值

3.离散型随机变量的一些例子

试验 随机变量 可能的取值
抽查100个产品 取到次品的个数 0,1,2,...,100
一家餐馆营业一天 顾客数 0,1,2,...
电脑公司一个月的销售 销售量 0,1,2,...
销售一辆汽车 顾客性别 男性为0;女性为1

连续型随机变量(continuous random variables)

  1. 随机变量X取无限个值
  2. 所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点
  3. 连续型随机变量的一些例子
试验 随机变量 可能的取值
抽查一批电子元件 使用寿命(小时) X>=0
新建一座住宅楼 半年后工程完成的百分比 [0,100]
测量一个产品的长度 测量误差(cm) X>=0
5.2.2 离散型随机变量的概率分布
  1. 列出离散型随机变量X的所有可能取值

  2. 列出随机变量取这些值的概率

  3. 通常用下面的表格表示

X=xix1,x2,...,xnP(X=xi)=pip1,p2,...pn

  1. P(X=xi)=pi

    称为离散型随机变量的概率函数

    p>=0i=1npi=1

    离散型随机变量的概率分布形式(0-1分布)

    1. 一个离散型随机变量X只取两个可能的值
      1. 例如,男性用1表示,女性用0表示,合格品用1表示,不合格用0表示
    2. 列出随机变量取这两个值的概率

    离散型随机变量的概率分布(均匀分布)

    1. 一个离散型随机变量取各个值得概率相同
    2. 列出随机变量取值及其取值的概率
    3. 例如,投掷一枚骰子,出现的点数及其出现各点的概率
离散型随机变量的期望值和方差

离散型随机变量的期望值(expected value)

  1. 在离散型随机变量X的一切可能取值的完备组中,各可能取值x_i与其取对应的概率p_i乘积之和
  2. 描述离散型随机变量取值的集中程度
  3. 计算公式为

E(X)=i=1nxipi(X)E(X)=i=1nxipi(X)

离散型随机变量的方差(variance)

  1. 随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)
  2. 描述随机变量取值的分散程度
  3. 计算公式为

D(X)=E[XE(X)]2XD(X)=i=1[xiE(X)]2pi

离散系数:可用来比较不同期望值得总体之间的离中趋势

几种常见的离散型概率分布

二项分布(贝努利试验)

  1. 二项分布与贝努利试验有关
  2. 贝努利试验具有如下属性
    1. 试验包含了n个相同的试验
    2. 每次试验只有两个可能的结果,即“成功”和“失败”
    3. 出现“成功”的概率p对每次试验结果是相同的,“失败”的概率q也相同,且p+q=1
    4. 试验是相互独立的
    5. 试验“成功”或“失败”可以计数

二项分布(Binomial distribution)

  1. 进行n次重复试验,出现“成功”的次数的概率分布称为二项分布
  2. 设X为n次重复试验中事件A出现的次数,X取x的概率为

P{X=x}=Cnxpxqnx(x=0,1,2,..,n)Cnx=n!x!(nx)!

二项分布的性质

  1. 显然,对于

P{X=x0},x=1,2,...,nx=0nCnxpxqnx=(p+q)n=1

  1. 同样有

P{0Xm}=x=0mCnxpxqnxP{mXn}=x=mnCnxpxqnx

  1. 当n=1时,二项分布化简为

P{X=x}=pxq1xx=0,1

二项分布的数学期望和方差

  1. 二项分布的数学期望为

    1. E(X)=np

  2. 方差为

    1. D(X)=npq

珀松分布(Poisson distribution)

  1. 用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布
  2. 珀松分布的例子
    1. 一个城市在一个月内发生交通事故次数
    2. 消费者协会一个星期内收到的消费者投诉次数
    3. 人寿保险每天收到的死亡声明的人数

珀松概率分布函数

P{X=x}=λeλx!(x=0,1,2,...,n)

λ:""e=2.71828x:""

珀松分布的数学期望和方差

1.珀松分布的数学期望

E(X)=λ

2.方差为

D(X)=λ

珀松分布(作为二项分布的近似)
  1. 当试验的次数n很大,成功的概率p很小时,可用珀松分布来近似计算二项分布的概率,即

Cnxpxqnxλeλx!

  1. 实际应用中,当

    P0.25,n>20,np5

    近似效果良好

5.3连续型随机变量的概率分布

连续型随机变量的概率分布

  1. 连续型随机变量可以取某一区间或整个实数轴上的任意一个值
  2. 它取任何一个特定的值得概率都等于0
  3. 不能列出每一个值及其相应的概率
  4. 通常研究它取某一区间值的概率
  5. 用数学函数的形式和分布函数的形式来描述
5.3.1 概率目的与分布函数

概率密度函数(probability density function)

  1. 设X为一连续型随机变量x,x为任意实数,X的概率密度函数记为f(x),它满足条件

(1)f(x)0(2)+f(x)dx=1

  1. f(x)不是概率

在平面直角坐标系中画出f(x)的图形,则对于任何实数

x1<x2,P(x<xx2)

是该曲线下从x_1到x_2的面积

P(a<Xb)=abf(x)dx

【统计学】概率密度函数

分布函数(distribution function)

  1. 连续型随机变量的概率也可以用分布函数F(x)来表示
  2. 分布函数定义为

F(x)=P(Xx)=xf(t)dt(<x<+)

  1. 根据分布函数,

P(a<X<b)

可以写为

P(a<X<b)=abf(x)dx=F(b)F(a)

分布函数与密度函数的图示

  1. 密度函数曲线下的面积等于1
  2. 分布函数是曲线下小于x的面积
  3. 【统计学】分布函数与密度函数的分布

连续型随机变量的数学期望和方差

  1. 连续型随机变量的数学期望为

E(x)=+xf(x)dx=μ

  1. 方差为

D(X)=+[xE(X)]f(x)dx=σ2

5.3.2 正态分布

正态分布(normal distribution)

  1. 描述连续型随机变量的最重要的分布
  2. 可用于近似离散型随机变量的分布
    1. 例如:二项分布
  3. 经典统计推断的基础

【统计学】正态分布

概率密度函数

f(x)=1σ2πe12σ2(xμ)2<x<+

f(x)=Xσ2=π=3.14159;e=2.71828x=(<x<+)μ=

正态分布的性质

  1. 概率密度函数在x的上方,即f(x)>0
  2. 正态曲线的最高点在均值μ,它也是分布的中位数和众数
  3. 正态分布是一个分布族,每一特定正态分布通过均值μ和标准差sigma来区分。μ决定了图形的中心位置,sigma决定曲线的平缓程度,即宽度
  4. 曲线f(x)相对于均值μ对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交
  5. 正态曲线下的总面积等于1
  6. 随机变量的概率由曲线下的面积给出
  7. 【统计学】正态曲线的影响
  8. 概率是曲线下的面积
标准正态分布
  1. 一般的正态分布取决于均值μ和标准差sigma

  2. 计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的

  3. 若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表

  1. 任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布

Z=XμσN(0,1)

  1. 标准正态分布的概率密度函数

ϕ(x)=12πex22<x<+

  1. 标准正态分布的分布函数

Φ(x)=xϕ(t)dt=x12πet22dt

标准正态分布表的使用
  1. 将一个一般的转换为标准正态分布
  2. 计算概率时,查标准正态概率分布表
  3. 对于负的x,可由

ϕ(x)=1ϕ(x)

得到

  1. 对于标准正态分布,即

    XN(0,1)

    P(aXb)=ϕ(b)ϕ(a)P(|X|a)=2ϕ(a)1

  2. 对于一般的正态分布,即

XN(μ,σ2)

P(aXb)=ϕ(bμσ)ϕ(aμσ)

posted on   pandaboy1123  阅读(768)  评论(0编辑  收藏  举报

编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
历史上的今天:
2018-05-10 JS实现HTML打印机效果
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示