摘要: 3.1 决策树的构造 3.1.1 信息增益 熵(entropy)是信息的期望值。如果待分类的事物可能划分在多个分类中,则符号xi的信息定义为:,p(xi)为该分类的概率。 为了计算熵,需计算所有类别所有可能包含的信息期望值:,n是分类的数目。 3.1.2 划分数据集 分类算法需要:上述的测量信息熵、 阅读全文
posted @ 2015-12-06 21:21 hudongni1 阅读(134) 评论(0) 推荐(0) 编辑