点估计及矩估计的一些理解
点估计指的是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。在这个定义中,总体参数也即是总体分布的参数,一般我们在讨论总体分布的时候,只有在简单随机样本(样本独立同分布)情况下才有明确的意义,总体分布才能决定样本分布,所以下文样本中各随机变量均为独立同分布。在大数据中分析中,一般都假设样本是独立同分布的。
矩估计方法是点估计中的一种,其原理就是构造样本和总体的矩,然后用样本的矩去估计总体的矩。设有样本而k为自然数,则样本矩做如下定义
其中称为k阶样本原点矩,
称为k阶样本中心距,
为样本均值。
和
可以由样本计算得到确定的值。接下来再构造总体
的矩。在使用矩估计方法时,一般要求知道总体的分布类型,这样才能构造包含待估参数的矩。
当总体为连续分布时,设为总体分布的概率密度函数,
为总体分布中的待估参数(假设此处总体分布中只有一个待估参数
),则总体的k阶原点矩
、k阶中心距
分别定义为如下形式
当总体为离散分布时,设是
时的概率,则总体的k阶原点矩
、k阶中心距
分别定义为如下形式
在用样本矩估计总体矩时,我们还需要知道样本矩对总体矩而言是无偏估计,还是非无偏估计,这样有助于我们把握估计偏差,下面以样本一阶原点矩、二阶中心矩
为例来估计总体的一阶原点矩
和
,观察它们是否为无偏估计
可以看到,样本一阶原点矩为总体的一阶原点矩
的无偏估计,再看二阶中心矩的估计
下面分别就项和
项进行计算
因此可得
(1)
样本统计量的方差
为
可得
由于,且样本中各变量为独立同分布,所以
这样就得到
(2)
由式(1)和式(2),可以得到
可以看到,样本的二阶中心矩并非总体的二阶中心矩的无偏估计,但是我们可以采用因子来调整这个估计偏差,但一般在应用上不去做调整而是容忍一些偏差存在,在n较大时,这个偏差对于应用无损。
以上的内容只是计算过程推导,而我们更应该关注的是这些矩在实际应用中表示的是什么含义,这更有助于我们分析问题。依据总体的k阶原点矩和中心距,还可以定义以下参数,它们能反应总体分布的一些特征
偏度(Skewness):,反映总体分布的“非对称性”或“偏倚性”
峰度(Kurtosis) : ,反映总体分布陡峭或平滑的程度
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 【杂谈】分布式事务——高大上的无用知识?