数理统计笔记

常见的分布函数

二项分布

alt text

几何分布

alt text

超几何分布

alt text

泊松分布

alt text

alt text

均匀分布

alt text

指数分布

alt text

正态分布

alt text

标准正态分布

alt text

alt text

二项分布和泊松分布之间的关系

泊松分布可以看作是二项分布的一种极限形式。当考虑一个二项分布问题,如果试验次数𝑛非常大,而每次试验成功的概率𝑝非常小,但乘积𝑛𝑝(期望值)保持在一个有限的常数𝜆,这时二项分布就可以近似为泊松分布。这意味着,在大量独立的伯努利试验中,如果每次试验成功的概率很小,关注的是成功次数而不是每次试验的具体结果时,泊松分布提供了一个更简便的模型。

在上述极限情况下,泊松分布的参数𝜆实际上等于二项分布中成功次数的期望值𝑛𝑝。这表明泊松分布中的事件发生率𝜆可以直接通过二项分布的参数𝑛和𝑝来确定

二项分布、泊松分布、正态分布的特性

其中的二项分布B和泊松分布P具有可加性

alt text

正态分布之和的特性

alt text

常用函数的期望与方差

alt text

alt text

常用分布函数

正态分布

alt text

卡方分布

alt text

卡方分布的性质

alt text

t分布

alt text

t分布的性质

alt text

F分布

alt text

alt text

F分布的性质

alt text

经典题目

alt text

alt text

alt text

分布函数与密度函数

分布函数的定义

分布函数是指随机变量小于一个数值x的概率,准确来说分布函数应该叫做累计分布函数

alt text

通常分布函数采用大写字母F来表示,P表示x点发生的概率

从而可以得出以下的性质

alt text

分布函数与密度函数的关系

alt text

alt text

alt text

变量的独立性

alt text

独立的变量相加的方差运算

alt text

两个变量和的分布

alt text

alt text

变量和的分布运算方式与卷积类似

alt text

K阶原点矩与K阶中心距

alt text

原点距可以看成数据点到原点的距离

中心距则是数据到达数据中心点的距离

极差

alt text

分位数

alt text

alt text

抽样分布

正态总体的抽样分布

alt text

可以看出,抽样后的样本均值符合正态分布,抽样的均值等于总体均值,方差等于总体方差的1/n。

需要注意样本方差与卡方分布的系数中,卡方分布的自由度是n-1

alt text

alt text

alt text

alt text

样本均值

alt text

样本无偏方差

alt text

样本均值的期望

alt text

无偏方差的期望

alt text

alt text

alt text

点估计方法

矩法

矩估计是数理统计中一种常用的参数估计方法,它基于总体的矩(如均值、方差等)与参数之间的关系来进行估计。矩估计的基本思想是利用样本矩来估计相应的总体矩,进而通过总体矩与参数的关系来估计未知参数。这种方法直观、简便,并且适用于多种类型的分布。

alt text

alt text

极大似然估计

极大似然估计(Maximum Likelihood Estimation, MLE)是一种常用的参数估计方法,其核心思想是寻找一组参数值,使得观察到的数据出现的似然性(即概率)最大。换句话说,极大似然估计选择使数据观测值出现概率最大的参数值作为估计值。

alt text

顺序统计量法

alt text

alt text

评价估计量地标准

  • 无偏性
  • 有效性
  • 相合性

无偏性

alt text

有效性

alt text

alt text

alt text

alt text

相合性

alt text

置信区间

alt text

alt text

alt text

单侧置信区间

alt text

正态总体参数的置信区间

方差已知,均值的置信区间

alt text

alt text

方差未知,均值的置信区间

alt text

均值已知,方差的置信区间

alt text

alt text

均值未知,方差的置信区间

alt text

两个正态总体的情况

alt text

方差已知,均值的置信区间

alt text

方差未知,均值的置信区间

alt text

alt text

均值已知,方差比的置信区间

alt text

均值未知,方差比的置信区间

alt text

正态总体均值与方差的联合区间估计

alt text

alt text

alt text

0-1分布的参数区间估计

alt text

alt text

alt text

alt text

alt text

假设检验

alt text

alt text

alt text

检验的显著水平与两类错误

alt text

alt text

alt text

单正态总体的参数假设检验

均值的检验

alt text

alt text

alt text

alt text

方差的检验

alt text

alt text

两个正态总体的参数假设检验

alt text

均值差的检验

alt text

alt text

方差比的检验

alt text

alt text

非正态总体均值的假设检验

方差已知时总体均值的假设检验

alt text

alt text

alt text

alt text

alt text

方差未知时总体均值的假设检验

alt text

alt text

alt text

方差已知时两个总体均值的假设

alt text

alt text

alt text

方差未知时两个总体均值的假设

alt text

alt text

分布拟合检验

卡方检验

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

独立性检验

alt text

alt text

alt text

alt text

alt text

两个总体相等性检验

alt text

符号检验法

alt text

alt text

alt text

秩和检验法

alt text

alt text

alt text

alt text

alt text

alt text

alt text

游程检验法

alt text

alt text

alt text

alt text

回归分析

一元线性回归

alt text

alt text

最小二乘法

alt text

alt text

alt text

alt text

最小二乘法中a,b两个参数计算推导过程

线性回归的基本概念

线性回归模型假定因变量 y 与自变量 x 之间存在线性关系,可以表示为:

y=a+bx+ϵ

其中, a 是截距,b 是回归系数, ϵ 是误差项。

最小二乘法的目标

最小二乘法(Ordinary Least Squares, OLS)的目标是找到 ab 使得观测值 yi 与预测值 y^i 之间的误差平方和最小。即:
y^i=a+bxi

定义误差平方和(Sum of Squared Errors, SSE)为:

SSE=i=1n(yiy^i)2=i=1n(yi(a+bxi))2

ab 求导

我们通过对 SSE 关于 ab 求偏导数,并令其等于零,以找到使 SSE 最小的 ab

  1. a 求偏导数:

SSEa=i=1n2(yi(a+bxi))(1)=2i=1n(yiabxi)

令其等于零:

i=1n(yiabxi)=0

i=1nyinabi=1nxi=0

na+bi=1nxi=i=1nyi

  1. b 求偏导数:

SSEb=i=1n2(yi(a+bxi))(xi)=2i=1nxi(yiabxi)

令其等于零:

i=1nxi(yiabxi)=0

i=1nxiyiai=1nxibi=1nxi2=0

ai=1nxi+bi=1nxi2=i=1nxiyi

联立方程求解 ab

得到方程组:

na+bi=1nxi=i=1nyi

ai=1nxi+bi=1nxi2=i=1nxiyi

  1. 先求 b

记:

x¯=1ni=1nxi

y¯=1ni=1nyi

则方程组改写为:

ny¯=na+bi=1nxi

ny¯=na+bnx¯

y¯=a+bx¯

利用第二个方程:

ai=1nxi+bi=1nxi2=i=1nxiyi

代入 ( a = \bar{y} - b \bar{x} ):

(y¯bx¯)i=1nxi+bi=1nxi2=i=1nxiyi

y¯i=1nxibx¯i=1nxi+bi=1nxi2=i=1nxiyi

y¯i=1nxi+b(i=1nxi2x¯i=1nxi)=i=1nxiyi

整理得:

b=i=1nxiyiy¯i=1nxii=1nxi2x¯i=1nxi

  1. 再求 a

从上面推导出的关系:

a=y¯bx¯

最终回归系数公式

b=i=1n(xix¯)(yiy¯)i1n(xix¯)2

a=y¯bx¯

通过上述步骤,推导了最小二乘法的线性回归方程中的回归系数 ( b ) 和截距 ( a ) 的公式。

最小二乘法的相关性质

alt text

alt text

alt text

alt text

alt text

alt text

alt text

线性回归效果显著性检验

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

F检验法

alt text

alt text

t检验法

alt text

alt text

未知参数a,b和方差的区间估计

alt text

alt text

alt text

例题

alt text

要解答这道数理统计题目,我们需要进行线性回归分析。具体步骤如下:

A. 求 ηx 的线性回归方程

给定数据:

xi150160170180190200210220230240yi56.958.361.664.668.171.374.177.480.282.6

  1. 计算 x¯y¯

x¯=110i=110xi=150+160+170+180+190+200+210+220+230+24010=195

y¯=110i=110yi=56.9+58.3+61.6+64.6+68.1+71.3+74.1+77.4+80.2+82.610=69.51

  1. 计算 SxySxx

Sxy=i=110(xix¯)(yiy¯)=(150195)(56.969.51)+(160195)(58.369.51)++(240195)(82.669.51)

Sxx=i=110(xix¯)2=(150195)2+(160195)2++(240195)2

  1. 计算回归系数 b 和截距 a

b=SxySxx

a=y¯bx¯

B. 检验线性回归效果的显著性 (α=0.05)

  1. 计算回归平方和 SSR 和残差平方和 SSE

SSR=b2Sxx

SSE=i=110(yiy^i)2

  1. 计算均方误差 MSE

MSE=SSEn2

  1. 利用 F 检验:

F=SSRMSE

查表得到临界值 F0.05,1,n2,与计算出的 F 值比较。

C. 求回归系数 b 的区间估计 (1α=0.95)

  1. 计算标准误差 SEb

SEb=MSESxx

  1. 利用 t 分布确定区间:

b±t0.025,n2SEb

D. 求 x0=225kg 时,η0 的预测值及预测区间

  1. 预测值 y^0

y^0=a+bx0

  1. 预测区间:

y^0±t0.025,n2MSE(1+1n+(x0x¯)2Sxx)

方差分析

单因子模型

alt text

alt text

alt text

alt text

alt text

alt text

显著性检验

alt text

alt text

alt text

参数的估计

alt text

alt text

alt text

alt text

alt text

多重比较

alt text

alt text

alt text

齐次性检验

alt text

alt text

alt text

两个因素的方差分析

有交互作用的方差分析模型

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

alt text

无交互作用无重复试验的方差分析模型

alt text

alt text

alt text

alt text

附录

正态分布的积分表

alt text

卡方分布表

alt text

posted @   liangzander  阅读(41)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 为DeepSeek添加本地知识库
· 精选4款基于.NET开源、功能强大的通讯调试工具
· DeepSeek智能编程
· 大模型工具KTransformer的安装
· [计算机/硬件/GPU] 显卡
点击右上角即可分享
微信分享提示