2013年4月29日
摘要: PCA是一种能够通过提取数据主成分达到数据降维目的的无监督算法。因为数据之间(如自然图像的像素值)间都是存在冗余的,通过PCA可以将维度为256降到一个较低的近似向量。通过一个2D降到1D的例子来理解一下PCA的原理。假设有如下一堆二维数据,我们通过SVD奇异值变换可以找到,代表这堆数据的两个方向(特征向量的方向,为什么是特征向量,特征值呢?)怎么进行SVD变换呢?我们先计算这堆数据的协方差矩阵如下:数据变化的主方向就是sigma的主特征向量,次方向就是sigma的次特征向量。接下来我们计算旋转后的数据(也就是说把数据投影到以这两个特征方向为坐标轴的坐标平面内)如图:当我们只选取前面的k个主特 阅读全文
posted @ 2013-04-29 10:27 ahujack 阅读(1056) 评论(0) 推荐(0) 编辑