摘要: ID3是以信息增益作为划分训练数据集的特征,即认为信息增益大的特征是对分类结果影响更大,但是信息增益的方法偏向于选择取值较多的特征,因此引入了C4.5决策树,也就是使用信息增益率(比)来作为划分数据集的特征,信息增益率定义如下:。就是在ID3中已经计算出特征A的信息增益之后再除一个熵HA(D),HA... 阅读全文
posted @ 2015-09-23 15:55 lz3018 阅读(1050) 评论(0) 推荐(0) 编辑