【PCA完成降维的主要步骤】
1.将原始数据进行标准化(一般是去均值,如果特征在不同的数量级上,则还要将其除以标准差)
2.计算标准化数据集的协方差矩阵
3.计算协方差矩阵的特征值和特征向量
4.保留最重要(特征值最大)的前k个特征(k就表示降维后的维度)
5.找到这k个特征值对应的特征向量
6.将标准化数据集乘以该k个特征向量,得到降维后的结果
(1)读取数据
(2)去中心化:每个数据减去对应每列的平均值
(3)计算协方差矩阵
(4) 求特征值和特征向量
(5)特征值排序
(6)降维