主成分分析

一、用自己的话描述出其本身的含义:

1、特征选择

  当我们拿到一个数据集的时候,它其中的特征会有很多,如果我们直接导入计算运算量将是极其庞大和没用处的,所以要对特征进行降维选择性的舍弃,留住重要部分,这个操作就叫特征选择。

2、PCA

  PCA是一种很成熟的用来对数据集进行简化降维的一种算法,他是在保留最多有用特征的前提下,对数据进行降维,删除无用数据,并用算法计算出一套新的简便的数据替换老数据。

二、并用自己的话阐述出两者的主要区别

  特征选择是人为的进行主动的选择那些特征要那些不要来降维,而PCA是用一套成熟的算法来对数据自动的进行降维,是用一系列全新的和原数据等价的降维的数据对原数据进行替换。

posted @ 2020-04-30 22:00  CrJia  阅读(121)  评论(0编辑  收藏  举报