摘要: ridgeregression可以用来处理下面两类问题:一是数据点少于变量个数;二是变量间存在共线性。当变量间存在共线性的时候,最小二乘回归得到的系数不稳定,方差很大。这是因为系数矩阵X与它的转置矩阵相乘得到的矩阵不能求得其逆矩阵,而ridgeregression通过引入参数lambda,使得该问题得到解决。在R语言中,MASS包中的函数lm.ridge()可以很方便的完成。它的输入矩阵X始终为nxp维,不管是否包含常数项。下面分别介绍包含和不包含常数项时的输出:当包含常数项时,该函数对y进行中心化,以y的均值作为因子;对x进行中心化和归一化,以x中各个变量的均值和标准差作为因子。这样对x和y 阅读全文
posted @ 2013-09-18 15:07 小石头@shu 阅读(1193) 评论(0) 推荐(0) 编辑