机器学习-决策树
摘要:
既然上次讲到了随机森林,而随机森林是由多棵决策树构成的,现在就回头仔细看看决策树。 博客园中已经有介绍决策树的非常好的博文。其中详细介绍了ID3,C4.5决策树的构造,这篇博文主要关注在树的每个节点如何确定最佳分裂属性和剪枝。 1.确定最佳分裂属性 一般介绍决策树都是以ID3(Quinlan 1986)为例。ID3算法使用的是信息增益,信息增益的具体细节我不再赘述。在决策树的节点N上,ID3算法选取在该节点对应的训练样例集合D上用输入属性进行分类后信息增益最大的输入属性。信息增益的定义为:。其中S为节点N上的训练样例集合,A为某个输入属性。对于所有在节点N上可用的输入属性,我们选取信息增益值. 阅读全文
posted @ 2012-09-28 17:21 潘的博客 阅读(1815) 评论(0) 推荐(0) 编辑