总体和样本
一、点估计量
在某些情况下,我们并不知道总体参数的确切数值,只能通过样本估计总体参数。
点估计量就是通过样本对于总体参数的最佳猜测值。
例如:总体均值 总体均值点估计量
二、估计总体均值(样本估计总体)
在已知情况下,样本均值是我们能为总体均值做出的最好估计-样本均值是最有可能被作为总体均值的数值。
样本均值可作为总体均值的点估计量,记为: =
(样本均值)。
三、估计总体方差(样本估计总体)
由于样本比较与总体,数值数量变少,因此,与总体中数值偏离于均值的程度相比,样本中的数值更有可能更加密集在均值周围。
所以,样本数据的方差不是总体方差的最好估计方法,如果用样本方差估计总体方差,估计结果会稍微偏低。
通常,如果样本大小为n,可以用下面算式估计总体方差:
当需要估计总体方差时,样本数减-1。
四、估计总体比例(样本估计总体)
如果用代表样本样本比例,则可以用下式估计总体比例:
,
代表总体比例的点估计量。
五、比例的抽样分布(总体估计样本)
当总体比例p已知时,需要考虑大小为n的样本,得出所有样本比例的分布,该分布称作为“比例的抽样分布”或者“的分布”。
推导:
条件:总体糖球样本中红色糖球比例为p,样本大小为n。
随机变量X代表样本中红色糖球的数目,X~B(n,p)。红色糖球比例取决于X,即比例可作为另一随机变量X/n记作为,
期望:E(
) = E(X/n) = E(X)/n, X服从二项分布即E(X)=np,于是E(
)=p。
结果符合预期,我们期望样本中比例与总体比例相一致。
方差:Var(
) = Var(X/n)=Var(X)/n2=npq/n2=pq/n。
的分布:当n越大时,
的分布越接近正态分布,通常认为n>30时,
符合正态分布,此时
~ N(p, pq/n)。
应用:可通过的分布计算样本比例至少为某值的概率。
连续性修正:在利用正态分布计算概率时,需要进行连续性修正提高正确率,修正值为 +-1/2n。
比例的抽样分布用处:求出已知总体中取出某个样本比例的概率。
六、均值的抽样分布(总体估计样本)
当已知总体均值和方差
,需要考虑大小为n的样本,得出所有样本均值形成的分布,叫做“均值的抽样分布”,或者
的分布。
推导:已知袋装糖球总体,均值和方差
,一个包装袋糖球数量用X 表示,每一袋糖球都符合相同分布,用Xi代表随机选择一袋糖球中的糖球数量,均值
和方差
,
取n包糖球作为样本,X1到Xn表示包装袋中糖球数量,表示n袋糖球的容量均值。
的期望:E(
) = E(X1+X2+...+Xn/n) = 1/n(E(X1)+E(X2)+..+E(Xn)) = 1/n(n
) =
结果样本量为n的均值符合总体均值。
的方差:Var(
) = Var(X1+X2+...+Xn/n) = 1/n2(n
) =
/n
的分布
- 若X符合正态正态分布X~N(
,
) 则
符合正态分布
~N(
,
/n)
- 若n很大时,
可以用正态分布近似
~N(
,
/n)(中心极限定理:如果从一个非正态总体X中取出一个样本,且样本很大>30,则
的分布近似为正态分布)
应用:均值的抽样分布为我们提供了一种计算样本均值的概率的方法。
2020-0509-21:40