作业09

一、用自己的话描述出其本身的含义:

1、特征选择

特征选择就是从所有特征中选择部分特征作为训练集,即对现有特征的“取其精华,去其糟粕”,特征在选择前后可以改变值、也可以不改变值,只是选择后的特征维数肯定要比选择前小。

2、PCA

PCA是一种分析、简化数据集的技术,主要是将数据的主成分(包含信息量大的维度)保留下来,忽略掉对数据描述不重要的成分,应用于特征数量达到上百的时候,考虑数据的简化问题。

二、并用自己的话阐述出两者的主要区别

特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,不会改变原有的特征值;PCA就是从一个维度空间映射到另一个维度空间,会改变原有的特征值。

posted @ 2020-05-01 14:07  C137  阅读(105)  评论(0编辑  收藏  举报