摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 根据实际情况需要筛选出符合模型训练的特征,只是从一堆特征里单纯挑出需要的特征,没有对这些特征进行过修改和降维,形成新的特征 2、PCA 主成分分析PCA,他会根据特征数据的规律和主要成分将特征自动降维成更具代表性,更简洁的数据,降低数据的冗余量,使不 阅读全文
posted @ 2020-04-27 20:09 Chock17 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合? (1)首先什么是过拟合? 过拟合是指训练模型时过于严格,学习能力太强,导致训练出的模型过于复杂,学习到了很多无关紧要的特征,过度拟合的问题通常发生在变量(特征)过多的时候。这种情况下训练出的方程总是能很好的拟合训练数据,此时的代价函数可能 阅读全文
posted @ 2020-04-27 15:18 Chock17 阅读(194) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 算法运用: from sklearn.feature_selection import VarianceThresh 阅读全文
posted @ 2020-04-27 09:53 Chock17 阅读(320) 评论(0) 推荐(0) 编辑