9、主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后。可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。

2、PCA

它是一种分析,简化数据集的技术。,是数据维数压缩,尽可能尽可能降低原数据的维数(复杂度),损失少量信息,可以消减回归分析或聚类分析中特征的数量。

对一件物品以不同的角度,给予不同的描述。使用条件是当特征数量达到上百的时候。使用后:数据会发生变化,特征数量也会减少。

以下两种多是不全的表现:

 

以下为上图例题中PCA正确表现:

二、并用自己的话阐述出两者的主要区别

特征选择:就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,不会改变原有的特征值(特征在选择前和选择后不改变值,但是选择后的特征维数肯定比选择前小);

PCA:  就是从一个维度空间映射到另一个维度空间,会改变原有的特征值(PCA会对数据进行改变,同时特征数量也会减少)。

 

posted @ 2020-04-28 08:03  皎月星辰  阅读(123)  评论(0编辑  收藏  举报