一、用自己的话描述出其本身的含义:
1、特征选择
2、PCA
特征选择:单纯的从提取到的所有特征中选择部分特征作为训练集特征,特征在选择后可以改变值、也不改变值,但是选择特征后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征,部分特征的相关度高,容易消耗计算性能,部分特征对预测结果有影响。(人为处理)
PCA:数据太多,人为处理不过来时,用PCA进行处理。PCA的本质是一种分析、简化数据的技术。目的是数据维护压缩,尽可能降低原数据的维数,损失少量信息。可以消减回归分析或者聚类分析中特征的数量。(机器处理)特征数量达到上百的时候,考虑简化,数据,数据也会改变,特征数量也会减少。
二、并用自己的话阐述出两者的主要区别
区别:
特征选择:特征在选择后可以改变值、也不改变值,但是选择特征后的特征维数肯定比选择前小。(人为处理)
PCA:简化数据,数据也会改变,特征数量也会减少。(机器处理)