统计学——复习笔记

算数平均数计算

\[\bar x = \frac{\sum^n_{i=1}x_i}{n} \]

加权算术平均数

\[\bar x = \frac{\sum^n_{i=1}x_i*f_i}{\sum^n_{i=1}f_i} \]

其中,\(x_i\) 表示各组平均水平值,\(f_i\) 代表频数。

例题

\[解:\bar x=\frac{1070+11100+...+14*100}{70+100+...+100} \]

调和平均数(倒数平均数)

\[\bar x_h=\dfrac{n}{\sum^n_{i=1}\frac{1}{x_i}} \]

先取倒数再计算。

例题

\[已知(x,y,z),则Ans=\dfrac{3}{\frac{1}{x}+\frac{1}{y}+\frac{1}{z}} \]

加权调和平均数

\[\bar x_h=\dfrac{\sum^n_{i=1}n}{\sum^n_{i=1}\frac{n}{x_i}} \]

例题1

例题2

几何平均数

\[\bar x_g=\sqrt[n]{\prod^n_{i=1}x_i} \]

例题1

题目中说按照复利,故使用几何平均数。当按照单利计算时,答案如下:

例题2

在组距数列中确定中位数

假定数据均匀分布,直接推导可以得到答案,公式傻长,建议手推,不要背

在组距数组中确定众数

\[M_o=L+\dfrac{\Delta_1}{\Delta_1+\Delta_2}*i \]

在组距数组中确定四分位数

同中位数的计算.

极差(全距)

最大值-最小值 \(R=Max-Min\)

四分位差(內距)

四分之三分位数-四分之一位数

异众比率

\[假设众数为M_o,则异众比率V_r=\dfrac{\sum n-M_o}{\sum n} \]

例题

平均差

\[假设算术平均数是 \bar x,则平均差A·D=\dfrac{\sum^n_{i=1}|x_i-\bar x|}{n} \]

例题

加权平均差

\[假设加权算术平均数是 \bar X,则加权平均差A·D=\dfrac{\sum^n_{i=1}|x_i-\bar X|*f_i}{\sum_{i=1}^nf_i} \]

例题

方差

\[\sigma^2=\dfrac{\sum^n_{i=1}(x_i-\bar x)^2}{n}=\bar {x^2}-\bar x ^ 2 \]

即把平均差的绝对值换成了平方

例题

加权方差

\[\sigma^2=\dfrac{\sum^n_{i=1}(x_i-\bar X)^2*f_i}{\sum_{i=1}^nf_i} \]

样本方差

把方差的分母多减去一个 \(1\) ,加权样本方差同。

标准差

方差开平方。

离散系数

\[V_\sigma = \dfrac {\sigma}{\bar x} \]

标准差除以算术平均数

例题

这里只演算产品销售额:首先计算 \(\bar x=536.25\) ,随后计算 \(\sigma =\sqrt{\dfrac{\sum^n_{i=1}(x_i-\bar x)^2}{n-1}} \approx 309.1896\) ,随后计算 \(V_\sigma=\dfrac {\sigma}{\bar x}\approx 0.577\)

是非标志

即将普通的 \((x_1,x_2,...,x_N)\) 变为 \((0,1)\) ,公式同上,稍微变换即可。

  • 均值:\(\bar x=\dfrac{1*f_1+0*f_2}{n}\)
  • 标准差:记 \(P=\dfrac{f_1}{n},Q=\dfrac{f_2}{n}\) ,则可以简化为 \(\sigma=\sqrt{P*Q}\)
  • 方差:\(简记为\sigma^2=P*Q\)

标准差系数

\[简记为 V=\sqrt {\dfrac{Q}{P}} \]

例题

样本平均数的抽样标准误差

重复抽样时:\(\mu=\sqrt{\dfrac{\sigma^2}{n}}\) ,不重复抽样时:\(\mu=\sqrt {\dfrac{\sigma^2}{n}(\dfrac{N-n}{N-1})}\)

样本成数的抽样标准误差

即在 \(N\) 个样本中随机挑选 \(n\) 个进行抽查——发现合格率是 \(p\) ,则

重复抽样时:\(\mu=\sqrt{\dfrac{p*(1-p)}{n}}\) ,不重复抽样时:\(\mu=\sqrt {\dfrac{p*(1-p)}{n}(\dfrac{N-n}{N-1})}\)

抽样极限误差计算

在原来的抽样标准误差的基础上乘以 \(t\) 得到误差 \(\Delta\)

样本成数、样本平均数的极限误差:\(\Delta=t*\mu\)

置信区间

由上面计算出的误差,可以得到置信区间的范围:

  • 总体平均数的置信区间——\(\bar x -\Delta \le \bar X \le \bar x + \Delta\)
  • 总体成数的置信区间——\(p -\Delta \le P \le p + \Delta\)

推测总数平均数需要的样本容量

  • 重复抽样—— \(n=\dfrac{t^2\sigma^2}{\Delta^2}=\dfrac{\sigma^2}{\mu^2}\)
  • 不重复抽样—— \(n=\dfrac{Nt^2\sigma^2}{N\Delta^2+t^2\sigma ^2}=\dfrac{N\sigma ^2}{N\mu ^2+\sigma ^2}\)

推测总数成数需要的样本容量

  • 重复抽样—— \(n=\dfrac{t^2p(1-p)}{\Delta^2}=\dfrac{p(1-p)}{\mu^2}\)
  • 不重复抽样—— \(n=\dfrac{Nt^2p(1-p)}{N\Delta^2+t^2p(1-p)}=\dfrac{Np(1-p)}{N\mu ^2+p(1-p)}\)

一元线性回归模型

\[\left\{\begin{matrix}b=\dfrac{n\sum xy-\sum x\sum y}{n\sum x^2-(\sum x)^2}\\a=\dfrac{\sum y}{n}-b\dfrac{\sum x}{n}=\bar y-b\bar x\end{matrix}\right. \]

\[r^2=\dfrac{\sum(\hat y-\bar y)^2}{\sum(y-\bar y)^2}=\dfrac{(n\sum xy-\sum x\sum y)^2}{(n\sum x^2-(\sum x)^2)(n\sum y^2-(\sum y)^2)}=\dfrac{a\sum y+b\sum xy-n \bar y^2}{\sum y^2-n\bar y ^2} \]

综合总指数公式

\(p\) 表示价格,\(q\) 表示销售量;下标 \(_0\) 表示基期,下标 \(_1\) 表示报告期;\(I\) 表示指数。

\[销售额总指数=\dfrac{\sum p_1q_1}{\sum p_0 q_0} \]

\[销售量(数量)总指数:I_q=\dfrac{\sum p_0q_1}{\sum p_0q_0}(拉式公式) \]

\[价格(质量)总指数:I_p=\dfrac{\sum p_1q_1}{\sum p_0q_1}(派式公式) \]

加权算术平均指数公式

已知“销售量个体指数”与”基期销售额“:

\[I_q=\dfrac{\sum k_qp_0q_0}{\sum p_0q_0},其中k_q=\dfrac{q_1}{q_0} \]

加权调和平均指数公式

已知”个体价格指数“与”报告期销售额“:

\[I_p=\dfrac{\sum p_1q_1}{\sum \frac{1}{k_p}p_1q_1},其中k_p=\dfrac{p_1}{p_0} \]

posted @ 2023-02-16 16:05  hh2048  阅读(181)  评论(0编辑  收藏  举报