摘要: 决策树原理:从数据集中找出决定性的特征对数据集进行迭代划分,直到某个分支下的数据都属于同一类型,或者已经遍历了所有划分数据集的特征,停止决策树算法。 每次划分数据集的特征都有很多,那么我们怎么来选择到底根据哪一个特征划分数据集呢?这里我们需要引入信息增益和信息熵的概念。 一、信息增益 划分数据集的原 阅读全文
posted @ 2017-11-01 10:28 嗜血的草 阅读(611) 评论(0) 推荐(0) 编辑