作业9
一、用自己的话描述出其本身的含义:
1、特征选择
一般是减少样本中不相关的特征,加快模型的训练速度和效率,比如预测今天是否会下雨,其中性别比例就是多余的特征。
2、PCA
就是识别数据中主要的特征,然后通过分析特征值,确定出需要保留的主成分个数,舍弃其他主成分,从而实现数据的降维。
二、并用自己的话阐述出两者的主要区别
特征选择是不改变原有数据的情况下进行特征的选择;
而PCA则是通过降维来“压缩”数据的特征,比如原数据中一个值是10,降维后变为5,从本质上来说,数据的特征并没改变。