转载请附上链接http://blog.csdn.net/iemyxie/article/details/38236647

算法简单介绍

主成分分析(PrincipalComponentAnalysis,简称PCA)一种经常使用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法

主要用于对特征进行降维。

算法如果

数据的概率分布满足高斯分布或是指数型的概率分布。

方差高的向量视为主元。

算法输入

包括n条记录的数据集

算法输出

降维或压缩后的数据集

算法思想

1.计算全部样本的均值m协方差矩阵S
2.计算S的特征值大到小排序;
3.选择前n'个特征值相应的特征矢量作成一个变换矩阵E=[e1,e2, …, en’]
4.最后。对于之前每个n维的特征矢量x能够转换为n’维的新特征矢量

    y=transpose(E)(x-m)

weka执行结果

以weather.nominal.arff为例执行结果部分截图例如以下:

算法应用

人脸识别

图像压缩

信号去噪

转载请附上链接http://blog.csdn.net/iemyxie/article/details/38236647
posted on 2017-05-26 12:41  yutingliuyl  阅读(265)  评论(0编辑  收藏  举报