一、用自己的话描述出其本身的含义:
1、特征选择
2、PCA
二、并用自己的话阐述出两者的主要区别
答:
1.特征选择也称属性选择。是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。
PCA(主成成分分析,即是特征的提取)是将输入特征转换为其主成分的系统化方式。这些主成分作为在分类或回归任务中新特征,主成分的定义是数据中会使方差最大化的方向,它是在对特征数据执行投影或压缩时,最大化的降低信息丢失。
2.区别:
特征选择得到的特征是原来特征的一个子集。
PCA提取的投影空间是协方差矩阵的特征向量。