机器学习第八次作业

一、用自己的话描述出其本身的含义:

1、特征选择:也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。

2、PCA:主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。

二、并用自己的话阐述出两者的主要区别

特征选择是减少特征来减少数据集维度,PCA是寻找 r ( r<n )个新变量,使它们反映事物的主要特征,压缩原有数据矩阵的规模,将特征向量的维数降低,挑选出最少的维数来概括最重要特征。

posted @ 2020-05-04 19:25  蔡云桓  阅读(113)  评论(0编辑  收藏  举报