摘要: 方法1:方差选择法 主要针对每个列进行计算,方差非常小的特征维度对于样本的区分作用很小,可以剔除掉。 例如:假设数据集为布尔型特征,想要去掉那些超过80%情况下为1或者为0的特征。由于布尔特征是伯努利随机变量,其方差可以计算为 Var[x] = p*(1-p),因此阈值为0.8*(1-0.8)=0. 阅读全文
posted @ 2019-11-22 10:03 像阳光,像春天 阅读(242) 评论(0) 推荐(0) 编辑