摘要: 一、概念多重线性回归模型:应变量为区间(定量)变量,且理论上要求其服从正态分布等LINE(线性、独立、正态、等方差)假定条件。Logistic回归:与多重线性回归类似,区别在于:应变量的类型不同,通过一组预报变量(自变量),采用Logistic回归,可以预测一个分类变量每一类发生的概率。应变量为分类变量,预报变量可以是区间变量、分类变量或区间和分类变量的混合。如果自变量均为区间变量也可以采用判别分析等方法进行分析。分类变量分为:有序分类变量(即有序多项分类变量)和无序分类变量(也称为名义变量)。无序分类变量分为二项分类变量和无序多项分类变量。例子:有效和无效(二项分类变量),很不满意、不满意、 阅读全文
posted @ 2012-05-10 16:36 跳刀的兔子 阅读(758) 评论(0) 推荐(1) 编辑
摘要: 一、主成分分析的几何意义(降维): 假定数据点是六维的;也就是说,每个观测值是 6 维空间中的一个点。我们希望把 6 维空间用低维空间表示。 先假定只有二维,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值;如果这些数据形成一个椭圆形状的点阵(这在变量的二维正态的假定下是可能的),那么这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。 当坐标轴和椭圆的长短轴平行,那么代表长轴的变量就描述了数据的主要变化,而代表短轴的变量就... 阅读全文
posted @ 2012-05-10 00:34 跳刀的兔子 阅读(7819) 评论(0) 推荐(0) 编辑