作业9、主成分分析
一、用自己的话描述出其本身的含义:
1、特征选择
我们提取得特征中有冗余特征,对模型的性能几乎没有帮助,所以我们要选择我们对我们研究有用的特征
2、PCA
我理解的是,如果事物的主要方面刚好体现在几个主要的变量,然后我们就只要把这几个主要的变量分离出来分析,但是大多数情况下不能直接找出这些主要变量,所以我们就利用原有变量的线性组合来表示事物的主要方面, PCA 就是这样一种分析方法
二、并用自己的话阐述出两者的主要区别
特征选择:选择方法是从原始特征数据集中选择出子集,是一种包含的关系,没有更改原始的特征空间。
PCA:降维的方法主要是通过属性间的关系,如组合不同的属性得新的属性,这样就改变了原来的特征空间。