数据的降维之特征选择及主成分分析
数据降维
维度:即特征的数量
数据降维的方法有:1.特征选择 2.主成分分析
特征选择:
代码实例:
from sklearn.feature_selection import VarianceThreshold def var(): ''' 特征选择-删除低方差的特征 特征减少 :return:None ''' var = VarianceThreshold(threshold=0.0) data = var.fit_transform([[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]) print(data) return None if __name__ == '__main__': var()
运行结果:
主成分分析PCA:
代码实例:
from sklearn.decomposition import PCA def pca(): ''' 主成分分析进行特征降维 :return:None ''' pca = PCA(n_components=0.9) data = pca.fit_transform([[2, 8, 4, 5], [6, 3, 0, 8], [5, 4, 9, 1]]) print(data) return None if __name__ == '__main__': pca()
运行结果: