一、用自己的话描述出其本身的含义:

1、特征选择

2、PCA

特征选择:单纯的从提取到的所有特征中选择部分特征作为训练集特征,特征在选择后可以改变值、也不改变值,但是选择特征后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征,部分特征的相关度高,容易消耗计算性能,部分特征对预测结果有影响。(人为处理)

PCA:数据太多,人为处理不过来时,用PCA进行处理。PCA的本质是一种分析、简化数据的技术。目的是数据维护压缩,尽可能降低原数据的维数,损失少量信息。可以消减回归分析或者聚类分析中特征的数量。(机器处理)特征数量达到上百的时候,考虑简化,数据,数据也会改变,特征数量也会减少。

 

二、并用自己的话阐述出两者的主要区别

区别:

特征选择:特征在选择后可以改变值、也不改变值,但是选择特征后的特征维数肯定比选择前小。(人为处理)

PCA简化数据,数据也会改变,特征数量也会减少。(机器处理)