摘要: 前言 所谓构建决策树, 就是递归的对数据集参数进行“最优特征”的选择。然后按最优特征分类成各个子数据集,继续递归。 最优特征的选择:依次计算按照各个特征进行分类以后数据集的熵,各个子数据集的熵比较后,其中拥有最小的熵的数据集就是最优的分类结果,此次分类的特征就是最优特征。 熵的计算:熵计算的是数据集 阅读全文
posted @ 2018-10-26 15:10 Red_Code 阅读(1104) 评论(0) 推荐(0) 编辑