2012年9月11日

关于决策树分类算法几点说明

摘要: 1、如果属性用完了怎么办 在决策树构造过程中可能会出现这种情况:所有属性都作为分裂属性用光了,但有的子集还不是纯净集,即集合内的元素不属于同一类别。在这种情况下,由于没有更多信息可以使用了,一般对这些子集进行“多数表决”,即使用此子集中出现次数最多的类别作为此节点类别,然后将此节点作为叶子节点。2、在实际构造决策树时,通常要进行剪枝,这时为了处理由于数据中的噪声和离群点导致的过分拟合问题。剪枝有两种: 先剪枝——在构造过程中,当某个节点满足剪枝条件,则直接停止此分支的构造。 后剪枝——先构造完成完整的决策树,再通过某些条件遍历树进行剪枝。 关于剪枝的具体算法这里不再详述,有兴趣的可以参考相关文 阅读全文

posted @ 2012-09-11 16:37 _Clarence 阅读(176) 评论(0) 推荐(0) 编辑

导航