9、主成分分析
一、用自己的话描述出其本身的含义:
1、特征选择
从数据集的所有特征里面选择和目标变量相关的特征,删除掉不需要的特征的过程
2、PCA
PCA全称主成分分析法,通常用来对数据特征进行降维,但PCA所谓的降维并不是真的砍掉某些维度,而是通过线性变换,找到一个更合适描述数据的空间。实际上是挖掘出特征间的隐含关系,同时找出数据中最关键的信息。
二、并用自己的话阐述出两者的主要区别
PCA:是用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征。在映射的过程中数据会发生改变,特征数量也会减少。
特征选择:就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后不改变值。