【温故知新】应用多元统计分析- -第一章 绪论
-
1.1 引言
多元统计分析(简称多元分析)是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,它是一元统计学的推广.在实际间题中,很多随机现象涉及到的变量不是一个,而经常是多个变量,并且这些变量间又存在一定的联系.
英国著名统计学家肯德尔(Kendall)在《多元分析》一书中把多元统计分析所研究的内容和方法概括为以下几个方面.
1.简化数据结构(降维问题)
简化数据结构即是将某些较复杂的数据结构通过变量变换等方法使相互依赖的变量变成互不相关的;或把高维空间的数据投影到低维空间,使问题得到简化而损失的信息又不太多的.例如主成分分析、因子分析,以及对应分析等多元统计方法就是这样的一类方法.
2.分类与判别(归类问题)
归类问题即是对所考察的观测点(或变量)按相似程度进行分类(或归类).例如聚类分析和判别分析等方法就是解决这类问题的统计方法.
3.变量间的相互联系
(1)相互依赖关系:分析一个或几个变量的变化是否依赖于另一些变量的变化?如果是,建立变量间的定量关系式,并用于预测或控制一一回归分析.
(2)变量间的相互关系:分析两组变量间的相互关系-一典型相关分析.
4.多元数据的统计推断
这是关于参数估计和假设检验的间题.特别是多元正态分布的均值向量及协方差阵的估计和假设检验等问题.
5.多元统计分析的理论基础
多元统计分析的理论基础包括多维随机向量及多维正态随机向量,以及由此定义的各种多元统计量,推导它们的分布并研究其性质,研究它们的抽样分布理论。这些不仅是统计估计和假设检验的基础,也是多元统计分析的理论基础.
1 .2多元统计分析的应用
略
1.3多元统计数据的图表示法
一、轮廓图
轮廓图的作图步骤为:
(1)作直角坐标系,横坐标取p个点,以表示p个变量;
(2)对给定的一次观测值,在p个点上的纵坐标(即高度)与对应的变量取值成正比;
(3)连结此p个点得一折线,即为该次观测值的一条轮廓线;
(4)对于n次观测值,每次都重复上述步骤,可画出n条折线,构成n次观测值的轮廓图.
二、雷达图
雷达图的作图步骤是:
(1)作一圆,并把圆周分为p等分;
(2)连结圆心和各分点,把这p条半径依次定义为各变量的坐
标轴,并标以适当的刻度;
(3)对给定的一次观测值,把p个变量值分别取在相应的坐标
轴上,然后将它们连结成一个p边形;
(4) n次观测值可画出n个p边形.
三、调和曲线图
四、散布图矩阵