一、用自己的话描述出其本身的含义:

1、特征选择

答:就是当数据预处理完成后,我们需要选择有意义的特征输入机器学习的算法和模型进行训练的这样一个过程。

2、PCA

答:在空间上,PCA可以理解为把原始数据投射到一个新的坐标系统,第一主成分为第一坐标轴,它的含义代表了原始数据中多个变量经过某种变换得到的新变量的变化区间;第二成分为第二坐标轴,代表了原始数据中多个变量经过某种变换得到的第二个新变量的变化区间。这样我们把利用原始数据解释样品的差异转变为利用新变量解释样品的差异。

二、并用自己的话阐述出两者的主要区别

PCA降维是从选择最优基向量来选择方差较大的维度,因为我们假定小方差维度携带的信息量可以忽略不计。

答:特征选择则是从模式识别的方向出发的数据处理方法,一些方法会利用到response信息。