摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 找出数据里最主要的方面,用数据里最主要的方面来代替原始数据 二、并用自己的话阐述出两者的主要区别 PCA是用于 阅读全文
posted @ 2020-04-27 21:49 妮妮妮kk 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 防止过拟合方法: 算法层面-正则化: L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。 L2正则,通过使得参数都趋于0,变得很小,降低模型的抖动,从而抵抗过拟合。 数据层面: 加 阅读全文
posted @ 2020-04-27 20:56 妮妮妮kk 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 代码: from sklearn.f 阅读全文
posted @ 2020-04-27 14:56 妮妮妮kk 阅读(97) 评论(0) 推荐(0) 编辑