关于数理统计基础知识的一点补漏
一、 数学期望
数学期望也称为均值、期望,在物理学中称为期待值。在概率论和统计学中,一个离散型随机变量的期望值是实验中每次可能结果的概率乘以其结果的总和。
定义:
离散型随机变量的一切可能取值与其对应的概率p的乘积之和称为数学期望。
需要注意的是,期望值并不一定等于常识中“期望”——期望值或许与每一个结果都不相等。换句话说,期望值是该变量输出值的*均数,因此期望值并不一定包含于变量的输出值集合里。
二、 方差(Variance)
方差是各个数据与*均数值差的*方的*均数。在概率论和数理统计中,方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。
样本中各个数据与样本均值的差的*方和的*均数叫做样本方差;样本方差的算术*方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大,越不稳定。
三、 标准差(Standard Deviation)
标准差也称为均方差(Mean Square Error),是各数偏离*均数的距离的*均数,它是离均值*方和*均后的方根。标准差是方差的算术*方根。标准差能反映一个数据集的偏离程度。
标准差也被称为标准偏差,或者实验标准差,公式:
如果是总体,标准差公式根号内除以n;如果是样本,标准差公式根号内除以(n-1),因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)。
简单来说,标准差是一组数据*均值分散程度的一种度量。一个较大的标准差,代表大部分数值和*均值之间差异较大;一个较小的标准差,代表这些数值较接**均值。
虽然标准差有计量单位,而方差无计量单位,但两者的作用一样。标准差用*方的方法消除了正负号,因而它是最常用、最重要的离散趋势统计量。标准差越大,表示变量值之间的差异越大,各数据距离均值越远,则*均数的代表性就越低。反之,标准差越小,表示变量之间的差异越小,各数据距离均值较*,则*均数的代表性越高。
标准差应用与投资上,可作为衡量回报稳定性的指标。标准差数值越大,代表回报远离过去*均数值,回报较不稳定。相反,标准差数值越小,代表回报较为稳定,风险亦小。
样本标准差:
在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差来估计的。
从一大组数值X1, X2, … , Xn中抽取一样本数值组合x1, x2, … , xn,n<N,常定义其样本标准差:
样本方差是对总体方差的无偏估计。s中分母为n-1(相较于总体中的分母为n),是因为的自由度为n-1,这是由于存在约束条件。