多元统计分析:易混知识点、假设检验与计算器使用

本文对多元统计分析中一些难记的结论进行集中整理,错误难免,如有发现请在评论区中指出。

Part 1:易混结论

正态分布的条件分布\(X^{(1)}\sim N_r(\mu^{(1)},\Sigma_{11})\)\(X^{(2)}\sim N_{p-r}(\mu^{(2)},\Sigma_{22})\)\({\rm COV}(X^{(1)},X^{(2)})=\Sigma_{12}\),则

  1. \(X^{(2)}\)\(X^{(1)} - \Sigma_{12}\Sigma_{22}^{-1}X^{(2)}\)相互独立,称\(\Sigma_{12}\Sigma_{22}^{-1}X^{(2)}\)\(X^{(1)}\)\(X^{(2)}\)方向上的投影。

  2. 给定\(X^{(2)}\)时,\(X^{(1)}\)的条件分布是

    \[X^{(1)}|X^{(2)}\sim N_r(\mu_{1\cdot2},\Sigma_{11\cdot 2}),\\ \mu_{1\cdot 2}=\mu^{(1)}+\Sigma_{12}\Sigma_{22}^{-1}(X^{(2)}-\mu^{(2)}),\\ \Sigma_{11\cdot 2}=\Sigma_{11}-\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}. \]

似然函数的最大取值 设数据矩阵为\(\boldsymbol X_{n\times p}\),正态分布\(N_p(\mu,\Sigma)\)的似然函数是

\[L(\mu,\Sigma;\boldsymbol X)=\frac{1}{(2\pi)^{np/2}|\Sigma|^{n/2}}\exp\left\{-\frac{1}{2}\sum_{j=1}^n(X_j-\mu)'\Sigma^{-1}(X_j-\mu) \right\}. \]

  1. 无论如何,\(\mu\)的极大似然估计点在\(\bar X\)

  2. 如果没有给定\(\mu\)的真值,则\(\Sigma\)的极大似然估计点是

    \[\frac{A}{n}. \]

    对多总体依然适用,即每一个\(\Sigma_i\)的极大似然估计点是

    \[\frac{A_{i}}{n_i}. \]

    公共极大似然估计点是

    \[\frac{A_1+\cdots+A_k}{n_1+\cdots+n_k}. \]

  3. 检验\(H_0=\sigma^2\Sigma_0\)时,\(\Sigma\)的极大似然估计点是

    \[\frac{1}{np}{\rm tr}(\Sigma_0^{-1}A)\cdot \Sigma_0 \]

    \(\sigma^2\)的极大似然估计点是

    \[\frac{1}{np}{\rm tr}(\Sigma_0^{-1}A). \]

  4. 分块对角阵检验时,每一个对角块\(\Sigma_{ii}\)的极大似然估计点是

    \[\frac{A_{ii}}{n}. \]

    注意这里与多总体\(\Sigma\)的估计不同。

  5. 如果参数空间与\(H_0\)空间的维度之差为\(f\),则似然比\(\lambda\)的极限分布是

    \[-2\ln\lambda\to\chi^2(f). \]

正态估计量的分布 设数据矩阵为\(\boldsymbol X_{n,p}\),正态总体\(N_p(\mu,\Sigma)\)的相关估计量有如下性质(及常用公式):

  1. \(\bar X\sim N_p(\mu,\frac{\Sigma}{n})\),即\(\sqrt{n}(\bar X-\mu)\sim N_p(0,\Sigma)\)
  2. \(A\sim W_p(n-1,\Sigma)\)
  3. \([\sqrt{n}(\bar X-\mu)]'\Sigma^{-1}[\sqrt{n}(\bar X-\mu)]\sim \chi^2(p)\)
  4. \((n-1)[\sqrt{n}(\bar X-\mu)]'A^{-1}[\sqrt{n}(\bar X-\mu)]\sim T^2(p,n-1)\)

\(T^2\)分布与\(F\)分布的转化 如果\(T^2\sim T^2(p,n)\),则

\[\frac{n-p+1}{np}T^2\sim F(p,n+p-1). \]

联合协方差阵 如果两个总体\(G_1\)\(G_2\)具有相同的协方差阵,则联合协方差阵为

\[S_{\text{pooled}}=\frac{A_1+A_2}{n_1+n_2-2}, \]

这里\(A_1\)\(G_1\)中抽取\(n_1\)个样本的离差阵,\(A_2\)\(G_2\)中抽取\(n_2\)个样本的离差阵。此后,用\(S_{\text{pooled}}\)作为\(\Sigma\)的估计。

线性判别函数 如果两个类的协方差阵相等为\(\Sigma\)(或在视为相等时使用联合协方差阵\(S\)),\(G_1\)的均值为\(\mu^{(1)}\)\(G_2\)的均值为\(\mu^{(2)}\)(或者它们的估计\(\bar X^{(1)}\)\(\bar X^{(2)}\)),则线性判别函数为

\[W(X)=\left[X-\frac{1}{2}(\mu^{(1)}+\mu^{(2)}) \right]'\Sigma^{-1}(\mu^{(1)}-\mu^{(2)}). \]

如果\(W(X)>0\),则判为\(G_1\);如果\(W(X)<0\),则判为\(G_2\)

一元判别的阈值 如果两个一元总体为\(N(\mu_1,\sigma_1^2)\)\(N(\mu_2,\sigma_2^2)\),则分离两类的阈值点是

\[x^*=\frac{\sigma_2\mu_1+\sigma_1\mu_2}{\sigma_1+\sigma_2}. \]

如果\(x>x^*\),则将样本判为均值大的总体,否则判为均值小的总体。这个方法主要用于Fisher判别得到的一元总体,还要注意\(a'\Sigma a\)是方差(而不是标准差\(\sqrt{a'\Sigma a}\))。

二类贝叶斯判别的损失函数\(G_1:N_p(\mu_1,\Sigma_1)\)的先验概率是\(q_1\)\(G_2:N_p(\mu_2,\Sigma)\)的先验概率是\(q_2\),则将样本\(X\)判给两类的平均损失是

\[h_1(X)=q_2f_2(X)L(1|2), \\ h_2(X)=q_1f_1(X)L(2|1). \]

如果只有两类,适合计算他们的比值而不是差值。

广义平方距离\(d^2(X,G)\)\(X\)到类\(G\)的马氏距离,\(\bar d^2(X,G)\)是类\(X\)到类\(G\)的广义平方距离,则

\[\bar d^2(X,G)=d^2(X,G)+\ln|\Sigma_g|-2\ln q_g. \]

这里\(\Sigma_g\)表示类\(G\)的协方差阵,\(q_g\)表示类\(G\)的先验概率。广义平方距离是在损失函数相同情况下,贝叶斯判别一种特例。

各种各样的特征值 在费希尔判别、主成分分析、因子模型、典型相关分析中都要求某矩阵的特征值和特征向量作为某种因素。

  1. 费希尔判别中,求的是\(A^{-1}B\)的特征值\(\lambda\)和特征向量\(a\)。这里\(A\)是组内离差阵,\(B\)是组间离差阵,\(\lambda\)是判别效率,判别能力即\(\lambda\)占特征值之和的比例。\(a'X\)是判别函数,此时特征向量不用单位化。

  2. 费希尔判别中,如果没有给定样本,则取\(A\)为各\(\Sigma\)的加和,\(B\)为各\((\mu_i-\bar \mu)(\mu_i-\bar \mu)'\)的加和,计算\(A^{-1}B\)的特征值。

  3. 主成分分析中,求的是\(\Sigma\)的特征值\(\lambda_i\)和单位特征向量\(a_i\)。第\(i\)主成分指的是第\(i\)大的特征值\(\lambda_i\)对应的单位特征向量\(a_i'X=Z_i\)。如果\(\Sigma\)未知,一般使用样本相关阵\(R\)

  4. 因子分析的主成分解中,求的是\(\Sigma\)的特征值\(\lambda_i\)和单位特征向量\(a_i\),选择\(m\)个特征值对应的特征向量\(a_i\)构成因子载荷矩阵:\((\sqrt{\lambda_i}a_i,\cdots,\sqrt{\lambda_m}a_m)\)。如果\(\Sigma\)未知,往往使用相关阵\(R\)计算。

  5. 典型相关分析中,求的是\(\Sigma_{11}^{-1}\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}\)\(\Sigma_{22}^{-1}\Sigma_{21}\Sigma_{11}^{-1}\Sigma_{12}\)的特征值\(\lambda\),典型相关系数为\(\sqrt{\lambda}\)。其中,\(\Sigma_{11}^{-1}\Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}\)的对应特征向量中满足\(a'\Sigma_{11}a=1\)的为所求的系数,\(\Sigma_{22}^{-1}\Sigma_{12}\Sigma_{11}^{-1}\Sigma_{12}\)的对应特征向量中满足\(b'\Sigma b=1\)的为所求的系数。

  6. 典型相关分析的另一种求解方式,求的是\(TT'\)的特征值\(\lambda\),典型相关系数是\(\sqrt{\lambda}\),这里,\(T=\Sigma_{11}^{-1/2}\Sigma_{12}\Sigma_{22}^{-1/2}\),对应的特征向量为\(l_i\),则

    \[a_i=\Sigma_{11}^{-1/2}l,\quad b_i=\frac{1}{\sqrt{\lambda}}\Sigma_{22}^{-1}\Sigma_{21}a_i. \]

类平均法的递推 如果含\(n_p\)个样本的类\(G_p\),与含\(n_q\)个样本的类\(G_q\),合并成含\(n_r=n_p+n_q\)个样本的类\(G_r\),则\(G_r\)与其他类\(G_k\)的距离递推式为

\[D^2_{rk}=\frac{n_p}{n_r}D^2_{pk}+\frac{n_q}{n_r}D^2_{qk}. \]

注意,此处均为距离的平方。

主成分分析相关概念 矩阵\(A=(a_1,a_2,\cdots,a_p)\),有\(Z=A'X\),这里\(X\sim N_p(\mu,\Sigma)\)\(Z\)\(p\)维列向量(主成分)。

  1. 总方差:\({\rm tr}(\Sigma)\),也即特征值之和,又叫总惯量。

  2. 因子负荷量:第\(k\)个主成分\(Z_k\)与总体第\(i\)个分量\(X_i\)之间的相关系数,即

    \[\rho(Z_k,X_i)=\frac{{\rm Cov}(a_k'X,e_i'X)}{\sqrt{\mathbb{D}(Z_k)\mathbb{D}(X_i)}}=\frac{e_i'\Sigma a_k}{\sqrt{\lambda_k\sigma_{ii}}}=\frac{e_i'\lambda_ka_k}{\sqrt{\lambda_k\sigma_{ii}}}=\frac{\sqrt{\lambda_k}a_{ik}}{\sqrt{\sigma_{ii}}}. \]

  3. 主成分对分量的贡献率:第\(k\)个主成分\(Z_k\)对第\(i\)个分量\(X_i\)的贡献率,定义为因子负荷量的平方,即

    \[\rho^2(Z_k,X_i)=\frac{\lambda_k a_{ik}^2}{\sigma_{ii}}. \]

    \(m\)个主成分对分量\(X_i\)的贡献率为

    \[\nu^{(m)}=\sum_{i=1}^m\rho^2(X_i,Z_k)\le 1. \]

  4. 主成分的贡献率:第\(k\)个主成分\(Z_k\)的贡献率是

    \[\frac{\lambda_k}{\sum_{i=1}^p \lambda_i}. \]

    \(m\)个主成分的贡献率是

    \[\frac{\sum_{k=1}^m\lambda_k}{\sum_{i=1}^p \lambda_i}. \]

  5. 主成分得分:第\(t\)个样品\(X^{(t)}=(x_{t1},\cdots,x_{tp})'\)的主成分得分为

    \[Z_{(t)}=A'X^{(t)}=\begin{bmatrix} a_1'X^{(t)} \\ \vdots \\a_p'X^{(t)} \end{bmatrix}=\begin{bmatrix} z_{t1} \\ \vdots \\ z_{tp} \end{bmatrix}. \]

    主成分得分矩阵为

    \[Z=\begin{bmatrix} Z_{(1)}' \\ \vdots \\ Z_{(n)}' \end{bmatrix}=\begin{bmatrix} z_{11} & z_{12} & \cdots & z_{1p} \\ z_{21} & z_{22} & \cdots & z_{2p} \\ \vdots & \vdots & & \vdots \\ z_{n1} & z_{n2} & \cdots & z_{np} \end{bmatrix}. \]

因子模型相关概念 有以下分解:\(\Sigma =AA'+D\)\(A_{p\times m}\)为载荷矩阵,\(D={\rm diag}(\varepsilon_1^2,\cdots,\varepsilon_p^2)\)为对角阵。

  1. 因子载荷:\(a_{ij}={\rm Cov}(X_i,F_j)\),称为分量\(X_i\)在因子\(F_j\)上的载荷。

  2. 变量共同度:\(A\)中第\(i\)行元素的平方和称为分量\(X_i\)的共同度,即

    \[h_i^2=\sum_{j=1}^m a_{ij}^2. \]

    \(h_i^2+\varepsilon_i^2=\mathbb{D}(X_i)\)

  3. 公因子贡献:\(A\)中第\(j\)列元素的平方和称为公因子\(F_j\)的贡献,即

    \[q_j^2=\sum_{i=1}^p a_{ij}^2. \]

    \(q_j^2\)越大代表公因子贡献越大。

因子得分 因子得分的计算方式有两种:加权最小二乘法(巴特莱特),回归法(汤普森)。

  1. 加权最小二乘法:因子得分为

    \[\hat F=(A'D^{-1}A)^{-1}(A'D^{-1})X. \]

  2. 最小二乘法:适用于主成分法求解的因子模型,因子得分为

    \[\hat F=(A'A)^{-1}A'X. \]

  3. 回归法:因子得分为

    \[\hat F=A'(AA'+D)^{-1}X. \]

典型相关分析相关概念 \(\mathbb{D}(X)=\Sigma_{11}\)\(\mathbb{D}(Y)=\Sigma_{22}\)\({\rm COV}(X,Y)=\Sigma_{12}\),且典型相关变量为\(V_k=a_k'X\)\(W_k=b_k'Y\)

  1. 典型相关系数:\(\rho(a_k'X,b_k'Y)=\sqrt{\lambda_k}\)

  2. 典型结构:原始变量与典型变量之间的相关系数阵,具体记\(A_{p\times p}=(a_1,\cdots,a_p)\)\(B_{q\times p}=(b_1,\cdots,b_p)\),则\(V=A'X\)\(W=B'Y\),典型结构包括

    \[{\rm COV}(X,V)=\Sigma_{11}A,\\ {\rm COV}(X,W)=\Sigma_{12}B,\\ {\rm COV}(Y,V)=\Sigma_{21}A,\\ {\rm COV}(Y,W)=\Sigma_{22}B. \]

  3. 典型相关得分:样品\(Z_{(t)}=(X_{(t)}',Y_{(t)}')'\)的数值代入第\(i\)对典型变量中,得到\((v_{ti},w_{ti})\)称为第\(t\)个样品\(Z_{(t)}\)对第\(i\)对样本典型变量的得分值。

典型冗余分析相关概念 由样本数据阵计算得到样本相关阵\(R\),进而计算得到典型变量列\(V=A'X\)\(W=B'X\)。记\(r(X_j,V_k)\)\(R_{11} A\)的第\(j\)行、\(k\)列元素,其他元素类似定义。

  1. \(k\)个变量解释本组变量总变差的百分比:记

    \[R_d(X;V_k)=\frac{1}{p}\sum_{j=1}^pr^2(X_j,V_k),\\ R_d(Y;W_k)=\frac{1}{q}\sum_{j=1}^q r^2(Y_j,W_k) \]

    为第\(k\)个典型变量\(V_k\)\(W_k\)解释本组变量\(X\)\(Y\)的总变差的百分比。

  2. \(m\)个变量解释本组变量总变差的百分比:

    \[R_{d}(X;V_1,\cdots,V_m)=\frac{1}{p}\sum_{k=1}^m\sum_{j=1}^pr^2(X_j,V_k),\\ R_d(Y;W_1,\cdots,W_m)=\frac{1}{q}\sum_{k=1}^m\sum_{j=1}^qr^2(Y_j,W_k). \]

  3. \(k\)个解释变量解释另一组变量变差的百分比:

    \[R_d(X;W_k)=\frac{1}{p}\sum_{j=1}^pr^2(X_j,W_k)=\rho^2_kR_d(X;V_k),\\ R_d(Y;V_k)=\frac{1}{q}\sum_{j=1}^qr^2(Y_j,V_k)=\rho^2_kR_d(Y;W_k). \]

  4. 冗余测度:称第一组典型变量的冗余测度为\(R_d(X;W_k)\),第二组典型变量的冗余测度为\(R_d(Y;V_k)\)

全相关系数 全相关系数用于刻画一个随机变量与一组随机变量之间的相关关系。记\(Y\)\(X=(X_1,\cdots,X_p)'\)的全相关系数为

\[R=\sqrt{\frac{\Sigma_{YX}\Sigma_{XX}^{-1}\Sigma_{XY}}{\sigma_{YY}}}. \]

Part 2:假设检验

关于均值

注意以下式子都是在\(H_0\)成立时的假定,从而如果p值过小,就拒绝原假设。

协方差阵已知,单总体均值检验 \(H_0:\mu=\mu_0\),此时\(\Sigma\)已知。

\[\sqrt{n}(\bar X-\mu)\sim N_p(0,\Sigma),\\ \hat{\chi}^2\xlongequal{def} n(\bar X-\mu)\Sigma^{-1}(\bar X-\mu)\sim \chi^2(p) \]

协方差阵未知,单总体均值检验 \(H_0:\mu=\mu_0\),此时\(\Sigma\)未知。

\[\sqrt{n}(\bar X-\mu)\sim N_p(0,\Sigma),\\ A\sim W_p(n-1,\Sigma),\\ \hat{T}^2\xlongequal{def}n(\bar X-\mu)'\left(\frac{A}{n-1} \right)^{-1}(\bar X-\mu)\sim T^2(p,n-1),\\ \frac{n-p}{(n-1)p}\hat T^2\sim F(p,n-p). \]

协方差阵未知但相等,双总体均值检验 \(H_0:\mu_1=\mu_2\)

\[A_1\sim W_p(n_1-1,\Sigma),\quad A_2\sim W_p(n_2-1,\Sigma),\\ A_1+A_2\sim W_p(n_1+n_2-2,\Sigma),\\ \bar X\sim N_p\left(\mu_1,\frac{\Sigma}{n_1}\right),\quad \bar Y\sim N_p\left(\mu_2,\frac{\Sigma}{n_2} \right),\\ \sqrt{\frac{n_1n_2}{n_1+n_2}}(\bar X-\bar Y)\sim N_p(0,\Sigma),\\ \hat{T}^2\xlongequal{def}\frac{n_1n_2}{n_1+n_2}(\bar X-\bar Y)'\left(\frac{A_1+A_2}{n_1+n_2-2} \right)^{-1}(\bar X-\bar Y)\sim T^2(p,n_1+n_2-2),\\ \frac{n_1+n_2-p-1}{(n_1+n_2-2)p}\hat {T}^2\sim F(p,n_1+n_2-p-1). \]

协方差阵未知但相等,多总体均值检验 \(H_0:\mu_1=\mu_2=\cdots=\mu_k\)

\[n\xlongequal{def}\sum_{t=1}^k n_t, \\ A\xlongequal{def}A_1+\cdots+A_k\sim W_p\left(n-k,\Sigma \right),\\ B\xlongequal{def}\sum_{t=1}^nn_t(\bar X^{(t)}-\bar X)'(\bar X^{(t)}-\bar X)\sim W_p(k-1,\Sigma).\\ \hat{\Lambda}\xlongequal{def}\frac{|A|}{|A+B|}\sim \Lambda(p,n-k,k-1). \]

关于协方差

协方差检验主要使用似然比检验,故先给出似然函数。

\[L(\mu,\Sigma)=\frac{1}{(2\pi)^{np/2}|\Sigma|^{n/2}}\exp\left\{-\frac{1}{2}\sum_{j=1}^n(X_j-\bar X)'\Sigma^{-1}(X_j-\bar X) \right\}. \]

均值未知,单位阵的检验 \(H_0:\Sigma=I_p\)

\[\begin{aligned} \hat\lambda&=\frac{L(\bar X,I_n)}{L(\bar X,A/n)}\\ &=\left|\frac{A}{n}\right|^{n/2}\exp\left\{-\frac{1}{2}\sum_{j=1}^n(X_j-\bar X)'\left(I_p-nA^{-1} \right)(X_j-\bar X) \right\}\\ &=\frac{|A|^{n/2}}{n^{np/2}}{\rm etr}\left\{-\frac{1}{2}(I_p-nA^{-1})A \right\}\\ &=\frac{|A|^{n/2}}{n^{np/2}}{\rm etr}\left\{-\frac{1}{2}A+\frac{n}{2}I_p \right\}\\ &=\left(\frac{e}{n} \right)^{np/2}|A|^{n/2}{\rm etr}\left\{-\frac{1}{2}A \right\},\\ &-2\ln\hat{\lambda}\stackrel {d}\to \chi^2\left(\frac{p(p+1)}{2} \right). \end{aligned}\\ \]

均值未知,正定阵的检验 \(H_0:\Sigma=\Sigma_0\)

\[Y\xlongequal{def}\Sigma_0^{-1/2}X\sim N(\Sigma_0^{-1/2}\mu,I_p).\\ \hat\lambda=\left(\frac{e}{n} \right)^{np/2}|A_y|^{n/2}{\rm etr}\left\{-\frac{1}{2}A_y \right\},\\ -2\ln\hat\lambda\stackrel{d}\to \chi^2\left(\frac{p(p+1)}{2} \right). \]

给定倍数的检验 \(H_0:\Sigma=\sigma^2\Sigma_0\)

\[\begin{aligned} L(\bar X,\sigma^2\Sigma_0)&=\frac{1}{(2\pi)^{np/2}|\sigma^2\Sigma_0|^{n/2}}\exp\left\{-\frac{1}{2}\sum_{j=1}^n(X_j-\bar X)'(\sigma^2\Sigma_0)^{-1}(X_j-\bar X) \right\}\\ &=\frac{1}{(2\pi\sigma^2)^{np/2}|\Sigma_0|^{n/2}}{\rm etr}\left\{-\frac{1}{2\sigma^2}(\Sigma_0^{-1}A) \right\},\\ l(\sigma^2)&=C-\frac{np}{2}\ln(\sigma^2)-\frac{1}{2\sigma^2}{\rm tr}(\Sigma_0^{-1}A),\\ \frac{\partial l}{\partial \sigma^2}&=-\frac{np}{2\sigma^2}+\frac{1}{2(\sigma^2)^2}\mathrm{tr}(\Sigma_0^{-1}A)=0,\\ \hat\sigma^2&=\frac{\mathrm{tr}(\Sigma_0^{-1}A)}{np}. \end{aligned} \]

代回得到

\[\begin{aligned} \hat\lambda&=\frac{L(\bar X,\hat\sigma^2\Sigma_0)}{L(\bar X,A/n)}\\ &=\frac{|\Sigma_0^{-1}A|^{n/2}}{(n\hat\sigma^2)^{np/2}}\exp\left\{-\frac{1}{2}\sum_{j=1}^n(X_j-\bar X)'\left((\hat\sigma^2\Sigma_0)^{-1}-(A/n)^{-1} \right)(X_j-\bar X) \right\}\\ &=\frac{|\Sigma_0^{-1}A|^{n/2}}{(n\hat\sigma^2)^{np/2}}\mathrm{etr}\left\{-\frac{1}{2}\left(\frac{\Sigma_0^{-1}A}{\hat\sigma^2}-nI_p \right) \right\}\\ &=\left(\frac{p}{\mathrm{tr}(\Sigma_0^{-1}A)} \right)^{np/2}|\Sigma_0^{-1}A|^{n/2}.\\ &-2\ln \hat\lambda\stackrel{d}\to \chi^2\left(\frac{p(p+1)}{2}-1 \right). \end{aligned} \]

多总体协方差阵检验 \(H_0:\Sigma_1=\Sigma_2=\cdots=\Sigma_k\)。似然比只包含指数外面的行列式部分。

\[\begin{aligned} &\quad\prod_{t=1}^k L(\bar X^{(j)},A_t/n_t)\\ &=\frac{1}{(2\pi)^{np/2}\prod_{t=1}^k|A_t/n_t|^{n_t/2}}\exp\left\{-\frac{1}{2}\sum_{t=1}^{k}\sum_{j=1}^{n_t}n_t(X_j^{(t)}-\bar X^{(j)})'A_t^{-1}(X^{(t)}_j-\bar X^{(j)})\right\}\\ &=(2\pi)^{-\frac{np}{2}}\prod_{t=1}^k\left|\frac{A_t}{n_t} \right|^{-\frac{n_t}{2}}\mathrm{etr}\left\{-\frac{n}{2}I_p \right\}\\ &=(2\pi)^{-\frac{np}{2}}\prod_{t=1}^k\left|\frac{A_t}{n_t} \right|^{-\frac{n_t}{2}}\exp\left(-\frac{np}{2} \right).\\ &\quad \prod_{t=1}^kL(\bar X^{(j)},A/n)\\ &=(2\pi)^{-\frac{np}{2}}\left|\frac{A}{n} \right|^{-n/2}\exp\left\{-\frac{1}{2}\sum_{t=1}^k\sum_{j=1}^{n_j}n(X^{(t)}_j-\bar X^{(j)})'A^{-1}(X_j^{(t)}-\bar X^{(j)}) \right\}\\ &=(2\pi)^{-\frac{np}{2}}\left|\frac{A}{n} \right|^{-n/2}\mathrm{etr}\left\{-\frac{n}{2}I_p \right\}\\ &=(2\pi)^{-\frac{np}{2}}\left|\frac{A}{n} \right|^{-n/2}\exp\left(-\frac{np}{2} \right). \end{aligned} \]

于是

\[\hat\lambda=\frac{\prod_{t=1}^k|\frac{A_t}{n_t}|^{n/2}}{|\frac{A}{n}|^{n_t/2}},\\ -2\ln\hat\lambda\stackrel{d}\to \chi^2\left(\frac{(k-1)p(p+1)}{2} \right). \]

独立性检验 \(H_0:\Sigma_{12}=O\)。假设两个分量的维度是\(r\)\(p-r\)

\[\begin{aligned} &\quad L^{(1)}(\bar X^{(1)},A_{11}/n)\cdot L^{(2)}(\bar X^{(2)},A_{22}/n)\\ &=\frac{1}{(2\pi)^{np/2}}\left|\frac{A_{11}}{n} \right|^{-n/2}\left|\frac{A_{22}}{n} \right|^{-n/2}\exp\left(-\frac{np}{2} \right)\\ &=(2\pi)^{-np/2}(|A_{11}||A_{22}|)^{n/2}\exp\left(-\frac{np}{2} \right),\\ &\quad L(\bar X,A/n)\\ &=\frac{1}{(2\pi)^{np/2}}\left|\frac{A}{n} \right|^{-n/2}\exp\left(-\frac{np}{2} \right)\\ &=(2\pi n)^{-np/2}|A|^{n/2}. \end{aligned} \]

于是

\[\hat \lambda=\left(\frac{|A_{11}|\cdot|A_{22}|}{|A|}\right)^{-n/2},\\ -2\ln\hat\lambda\stackrel{d}\to \chi^2[r(p-r)]. \]

Part 3:计算器使用

卡西欧991可以进行单变量统计。

单变量输入 设置61。如输入一组数据如下:

\[260,200,240,170,270,205,190,200,250,200. \]

单数据统计 输入完数据后,OPTN3,能得到以下数据:

数据 释义
\(\bar x\) 218.5 平均值
\(\sum x\) 2185 求和
\(\sum x^2\) 487625 求平方和
\(\sigma^2x\) 1020.25 求有偏估计的样本方差
\(\sigma x\) 31.94135251 求有偏估计的样本标准差
\(s^2x\) 1133.611111 求无偏估计的样本方差
\(sx\) 33.66914182 求无偏估计的样本标准差
\(n\) 10 计数
\(\min(x)\) 170 最小值
\(Q_1\) 200 第一分位数(大于25%)
\(Med\) 202.5 中位数
\(Q_3\) 250 第三分位数(大于75%)
\(\max(x)\) 270 最大值

双变量输入 设置62。如输入两组数据如下:

\[100, 110, 120, 130, 140\\ 5,2,1,3,4. \]

双变量统计 OPTN3,能得出以下数据:

数据 释义
\(\bar x\) 120 \(X\)的平均数
\(\sum x\) 600 \(X\)的求和
\(\sum x^2\) 73000 \(X\)的平方和
\(\sigma^2x\) 200 \(X\)的有偏估计方差
\(\sigma x\) 14.14213562 \(X\)的有偏估计标准差
\(s^2x\) 250 \(X\)的无偏估计方差
\(sx\) 15.8113883 \(X\)的无偏估计标准差
\(n\) 5 计数
\(\sum xy\) 1790 \(XY\)的求和
\(\sum x^3\) 9000000 \(X^3\)的求和
\(\sum x^2y\) 217700 \(X^2Y\)的求和
\(\sum x^4\) 1123540000 \(X^4\)的求和

正态分布 OPTN4进入正态分布页面,具有以下选项

实例与输出 释义
\(P(\) \(P(2)=0.97725\) 返回\(\Phi(x)\)的值
\(Q(\) \(Q(2)=0.47725\) 返回\(\mathrm{abs}(\Phi(x)-0.5)\)的值
\(R(\) \(R(2)=0.02275\) 返回\(1-\Phi(x)\)的值
\(\to t\) 已有单变量数据为:3,2,4,3。\(3\to t=0\) 在已有数据时,返回标准化后的值

矩阵输入 设置4,进入矩阵页面,选择一个矩阵,先输入行号列号,再输入元素。如果要更换其他矩阵,可以用OPTN键输入另一个矩阵。

矩阵运算 如果已经输入了两个矩阵如A、B,则可以在OPTN面板中选择进行乘法。如果要使用结果,则使用OPTN1;此外,还能对矩阵求逆、求行列式。

posted @ 2021-01-25 21:03  江景景景页  阅读(1504)  评论(0编辑  收藏  举报