主成分分析
1、特征选择
特征选择能剔除不相关或冗余的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。目标是寻找最优特征子集。
2、PCA
主成分分析(PCA)是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。主成分分析依赖所给数据,所以数据的准确性对分析结果影响很大。
3、两者区别
两者都是为了解决拟合问题。主要的区别是特征选择不会改变特征数据值而PCA会发生特征数据值的变化。