大方差特征的优势

 在统计学中,主成分分析PCA是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用于减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。

协方差能表示俩个向量的相关性。

PCA就是利用线性组合的方法降维。

首先求出各特征的协方差矩阵,然后求出矩阵的特征向量,各特征向其投影。最终得到降维结果,线性组合的方式,去除相关性大的冗余特征。

协方差矩阵是对称矩阵,所以可以考虑对称矩阵的特征向量。

1、实对称矩阵A的不同特征值对应的特征向量是正交的。

posted @ 2023-09-10 22:38  祥瑞哈哈哈  阅读(11)  评论(0编辑  收藏  举报