PCA的数学原理Matlab演示

关于

PCA(Principal component analysis)主成分分析。是SVD(Singular value decomposition)神秘值分析的一种特殊情况。主要用于数据降维。特征提取。

这里生成一个3∗3的小矩阵便于说明。

A = rand(3,3);

A = ⎡ ⎣ ⎢ 2.7694 - 1.3499 3.0349 0.7254 - 0.0631 0.7147 - 0.2050 - 0.1241 1.4897 ⎤ ⎦ ⎥

[V,D] = eig(A);

V = ⎡ ⎣ ⎢ 0.3046 0.9445 0.1230 - 0.7368 0.1518 0.6588 0.6036 - 0.2914 0.7421 ⎤ ⎦ ⎥

D = ⎡ ⎣ ⎢ 0.0655 00 0 1.3060 0 0020 ⎤ ⎦ ⎥

V是特征向量，D是特征向量相应的特征值。特征值从小到大依次为20,1.3060,0.0655。最后一个特征很小。由于我们能够舍去。

SubSpace = V(:,2:end);

S u b S p a c e = ⎡ ⎣ ⎢ - 0.7368 0.1518 0.6588 0.6036 - 0.2914 0.7421 ⎤ ⎦ ⎥

我们选取最大的两个特征值相应的特征向量。构成我们的子空间。

Q = SubSpace * SubSpace ’；

Q = ⎡ ⎣ ⎢ 0.9072 - 0.2877 - 0.0375 - 0.2877 0.1079 - 0.1162 - 0.0375 - 0.1162 0.9849 ⎤ ⎦ ⎥

B = Q'*A ;

B = ⎡ ⎣ ⎢ 2.7871 - 1.2953 3.0420 0.6494 - 0.2986 0.6841 - 0.2061 - 0.1276 1.4893 ⎤ ⎦ ⎥

能够看出这里我们使用子空间投影复原的矩阵B和原始矩阵A差异很小，我们能够使用Frobenius范数度量两个矩阵的差异。

 norm(A-B,'fro');

a n s = 0.2560

数学好的同学已经看出来了，事实上这也就是矩阵的低秩逼近问题。

min | | X - X r | | 2 F, s . t . r a n k (X r) < = r

完。

作者	日期	联系方式
风吹夏天	2015年8月10日	wincoder@qq.com

posted @ 2017-07-19 17:07 claireyuancy 阅读(309) 评论(0) 编辑收藏举报

刷新页面返回顶部