9、主成分分析
一、用自己的话描述出其本身的含义:
1、特征选择
特征选择是选择部分特征当做机器学习的相关数据,也就是特征选择后的特征是原来特征的一个子集。
2、PCA
主成分分析本质是一种分析,是简化数据集的技术,目的是数据维数压缩,尽可能降低原数据的维数,损失少量信息。
二、并用自己的话阐述出两者的主要区别
特征选择:特征较少时使用,从原含有多个特征的数据集中取出一部分特征用于训练模型,不会改变其原本的特征;
主成分分析:特征数量达到上百的时候,考虑数据简化,其削减了回归分析或者聚类分析中特征的数量,也就是它对数据维数进行了压缩,所以其改变了原来的特征值。