摘要: 上一节( "ID3原理及代码实现" )讲到的ID3算法存在不足,用信息增益作为特征选择标准会偏向取值较多的特征,因为特征的取值越多(该特征数据分的更细)即纯度更高,不确定性(条件熵越小$H(D|A)$)更低,由于$H(D)$是一定的,因此信息增益更大,所以偏向取值更多的特征。使用信息增益比可以矫正这 阅读全文
posted @ 2019-08-29 22:29 Christine_7 阅读(2613) 评论(0) 推荐(0) 编辑