9.主成分分析
一、用自己的话描述出其本身的含义:
1、特征选择
2、PCA
二、并用自己的话阐述出两者的主要区别
答:
1 特征选择:就是从原本的数据中,单纯地从提取到的所有特征中选择部分
特征作为训练集特征,本身的值没有任何改变,只是选取一部分特征进性训练,
而没有选择的那部分就被抛弃掉。
PCA:本质就是将数据从一个维度的空间映射到一个维度的空间,不过在
降维的时候,特征数量不会减少,但是特征值会改变,就像是现在的特征是1000
维,我们想要把它降到500维。降维的过程就是找个一个从1000维映射到500维
的映射关系。原始数据中的1000个特征,每一个都对应着降维后的500维空间
中的一个值。假设原始特征中有个特征的值是9,那么降维后对应的值可能是3。
2.两者的区别在于:
(1)特征选择是选取部分特征,这样子特征数量会减少,PCA是特征数量不会改变。
(2)特征选取不会使特征值发生改变,PCA会改变特征值
(3)特征选择适用于特征数量较少的(少于一百),PCA适用于多数量特征的(大于一百)