摘要: 一、决策树是一种基本的分类与回归方法。二、决策树学习的三个步骤:特征选择、生成决策树、决策树修剪 三、特征选择:特征选择的准则是信息增益或信息增益比 1、信息增益信息熵定义: 熵越大,随机变量的不确定性越大当随机变量只取两个值,0,1时,X的分布为: 熵为 此时,熵H(p)随概率p变化的曲线如下图所 阅读全文