2021年11月18日

决策树-更新

摘要: 对代码进行了优化更新 # 打算重头好好再写写这个 from math import log # 数据集 dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']] # 属性 labelSet = 阅读全文

posted @ 2021-11-18 22:54 lpzju 阅读(54) 评论(0) 推荐(0) 编辑

决策树-栽树

摘要: 现在来到了比较难的部分,将ID3的算法实现 这里如果跟着书敲一遍也能敲出来,但可能没办法很好地理解,以及自己去实现 由于本人基础缺失很差,故先自己敲了好几遍,然后再看西瓜书的图4-2.一点点明白 流程: 既然是栽树,首先得从根结点出发 如果此时样本都是同一属性,那么直接标记为相同结点,并且返回,一开 阅读全文

posted @ 2021-11-18 21:54 lpzju 阅读(30) 评论(0) 推荐(0) 编辑

决策树-属性选择2

摘要: 接上文,如果到了叶子结点,但是类标签不是唯一的,那么需要再进行处理一下 # 这里的代码作用是,如果到了叶子结点,但是还是不能区分 # 比如图3-2上面叶子结点要么都是yes要么都是no,但如果叶子结点上面是yes、yes、no,我们需要一个函数 # 来把这个叶子结点标记为yes,这就是majorit 阅读全文

posted @ 2021-11-18 11:02 lpzju 阅读(25) 评论(0) 推荐(0) 编辑

决策树-属性选择

摘要: 现在,我们要做的是进行属性(或者说特征)的选择 光看程序清单3-2,以及把数组带进去运行一遍可能也有点不清晰,最好先看一下西瓜书 然后意思是传进去一个数据集,对于某一列(axis=0表示第1列),如果为0(value=0),那么保留这一行但是不要这个属性对应的值 import shannonEnt 阅读全文

posted @ 2021-11-18 10:59 lpzju 阅读(146) 评论(0) 推荐(0) 编辑

导航