随笔分类 -  Weka数据挖掘学习

摘要:Mining Assocaition rule algrothm(挖掘相关规则的算法) 此算法中有两个关键参数,coverage(表示预测正确的案例个数,此参数用来筛选哪些实例个数大于或等于这个值得相关规则) accuracy(表示预测数据的精确度,此参数实际上是满足相关规则的实例的个数/满足规则前 阅读全文
posted @ 2017-07-29 15:15 张秀杰 阅读(278) 评论(0) 推荐(0)
摘要:覆盖算法:构建规则集合 树和规则的区别 树:是通过自上而下的分治算法来实现的。在一个多重类案例中,决策树在分裂的时候,为了获得最大的分裂纯度,要考虑所有的类。 规则:是由覆盖算法实现, 规则生成的方法,每次只考虑一个类,忽视其他类的事件。一般树形都比相同的规则集合要大的多。(因为树形每次都是分裂一个 阅读全文
posted @ 2017-07-28 12:20 张秀杰 阅读(461) 评论(0) 推荐(0)
摘要:OneR原理:一个属性决定类。 算法步骤 中文描述如下: For 对于每一个属性: For 对于属性的每一个值,创建规则如下: 计算每一个类(值)出现的次数 找到出现最多的类 创建规则:把这个出现最多的类赋值给属性值(比如 OutLook中Sunny-->yes) 计算每一个属性规则集合的错误率找到 阅读全文
posted @ 2017-07-26 09:36 张秀杰 阅读(1117) 评论(0) 推荐(0)
摘要:J48原理:本来名称为C4.8,由于是Java实现的算法,再加上C4.8为商业收费算法。 其实J48是自上而下的,递归的分治策略,选择某个属性放置在根节点,为每个可能的属性值产生一个分支,将实例分成多个子集,每个子集对应一个根节点的分支,然后在每个分支上递归地重复这个过程。当所有实例有相同的分类时, 阅读全文
posted @ 2017-07-25 17:24 张秀杰 阅读(6655) 评论(1) 推荐(0)