2013 年 4月 29 日随笔档案 - ahujack

2013年4月29日

摘要： PCA是一种能够通过提取数据主成分达到数据降维目的的无监督算法。因为数据之间（如自然图像的像素值）间都是存在冗余的，通过PCA可以将维度为256降到一个较低的近似向量。通过一个2D降到1D的例子来理解一下PCA的原理。假设有如下一堆二维数据，我们通过SVD奇异值变换可以找到，代表这堆数据的两个方向（特征向量的方向，为什么是特征向量，特征值呢？）怎么进行SVD变换呢？我们先计算这堆数据的协方差矩阵如下：数据变化的主方向就是sigma的主特征向量，次方向就是sigma的次特征向量。接下来我们计算旋转后的数据（也就是说把数据投影到以这两个特征方向为坐标轴的坐标平面内）如图：当我们只选取前面的k个主特阅读全文

posted @ 2013-04-29 10:27 ahujack 阅读(1056) 评论(0) 推荐(0) 编辑

公告