主成分分析
一、用自己的话描述出其本身的含义:
1、特征选择
当我们拿到一个数据集的时候,它其中的特征会有很多,如果我们直接导入计算运算量将是极其庞大和没用处的,所以要对特征进行降维选择性的舍弃,留住重要部分,这个操作就叫特征选择。
2、PCA
PCA是一种很成熟的用来对数据集进行简化降维的一种算法,他是在保留最多有用特征的前提下,对数据进行降维,删除无用数据,并用算法计算出一套新的简便的数据替换老数据。
二、并用自己的话阐述出两者的主要区别
特征选择是人为的进行主动的选择那些特征要那些不要来降维,而PCA是用一套成熟的算法来对数据自动的进行降维,是用一系列全新的和原数据等价的降维的数据对原数据进行替换。