9、主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

从数据集的所有特征里面选择和目标变量相关的特征,删除掉不需要的特征的过程

2、PCA

PCA全称主成分分析法,通常用来对数据特征进行降维,但PCA所谓的降维并不是真的砍掉某些维度,而是通过线性变换,找到一个更合适描述数据的空间。实际上是挖掘出特征间的隐含关系,同时找出数据中最关键的信息。

二、并用自己的话阐述出两者的主要区别

PCA:是用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征。在映射的过程中数据会发生改变,特征数量也会减少。

特征选择:就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后不改变值。

posted @ 2020-04-28 00:15  千初  阅读(105)  评论(0编辑  收藏  举报