摘要: 核心思想: 样本集D,属性集A 相关概念及公式 共有D组数据 K表示数据的某一种属性的一种样式,如西瓜色泽的:浅白,青绿,乌黑。 表示某一种属性的第k个取值所占的比例 信息熵表示当前计算属性的纯度,Ent(D)越小,D纯度越高。 信息熵(又称香农熵): 信息增益表示用数据的某一种属性来划分后所获的“ 阅读全文
posted @ 2019-04-08 21:48 LOSKI 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 决策树的实现太...繁琐了。 如果只是接受他的原理的话还好说,但是要想用代码去实现比较糟心,目前运用了《机器学习实战》的代码手打了一遍,决定在这里一点点摸索一下该工程。 实例的代码在使用上运用了香农熵,并且都是来处理离散数据的,因此有一些局限性,但是对其进行深层次的解析有利于对于代码的运作,pyth 阅读全文
posted @ 2019-04-08 21:46 LOSKI 阅读(1901) 评论(0) 推荐(0) 编辑