摘要: (1)如果缺值的样本占总数比例极高,我们可能就直接舍弃了,作为特征加入的话,可能反倒带入noise,影响最后的结果了; (2)如果缺值的样本适中,而该属性非连续值特征属性(比如说类目属性),那就把NaN作为一个新类别,加到类别特征中; 【注:NaN(Not a Number,非数)是计算机科学中数值 阅读全文
posted @ 2020-04-02 17:05 青菜蘸酱油 阅读(1754) 评论(0) 推荐(0) 编辑