9、主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

    在所有数据样本的特征中选择出对预测结果有影响的特征,比如,我们想要预测一部手机的使用寿命是多长时,在所有的特征中保留内存,处理器,损坏程度等等这些特征,可以去除掉手机的颜色,大小,重量等等这些无关的特征,这样我们就能集合有效的信息得到有效的预测结果。

2、PCA

    PCA是一种简化数据集的技术。它是通过把所有的数据投影为一个新的坐标系统中,即把属于这一方差的数据投影到这一主成分中,另一方差的数据投影到另一主成分中,同时保持数据集的对方差贡献最大的特征,即可达到降维的效果。

 

二、并用自己的话阐述出两者的主要区别

    特征选择是从所有特征中选择有效的特征作为数据进行预测,不改变原有的特征值,而PCA则是压缩数据空间,改变了特征值。

posted @ 2020-04-27 20:49  卡哇伊黑猫  阅读(151)  评论(0编辑  收藏  举报