摘要: 如图,为使用到的公式,信息熵表明样本的混乱程度,增益表示熵减少了,即样本开始分类,增益率是为了平衡增益准则对可取值较多的属性的偏好,同时增益率带来了对可取值偏小的属性的偏好,实际中,先用增益进行筛选,选取大于增益平均值的,然后再选取其中增益率最高的。 以下代码纯粹手写,未参考其他人代码,如果问题,请 阅读全文
posted @ 2019-09-30 00:38 我的锅 阅读(1164) 评论(1) 推荐(1) 编辑