作业9

一、用自己的话描述出其本身的含义:

 

1、特征选择

 

一般是减少样本中不相关的特征,加快模型的训练速度和效率,比如预测今天是否会下雨,其中性别比例就是多余的特征。

 

 

 

2、PCA

 

就是识别数据中主要的特征,然后通过分析特征值,确定出需要保留的主成分个数,舍弃其他主成分,从而实现数据的降维。

 

 

 

二、并用自己的话阐述出两者的主要区别

 

特征选择是不改变原有数据的情况下进行特征的选择;

 

而PCA则是通过降维来“压缩”数据的特征,比如原数据中一个值是10,降维后变为5,从本质上来说,数据的特征并没改变。

posted @ 2020-05-04 19:47  真真不知  阅读(162)  评论(0编辑  收藏  举报