摘要: 1、朴素贝叶斯算法介绍 一个待分类项x=(a,b,c...),判断x属于y1,y2,y3...类别中的哪一类。 贝叶斯公式: 算法定义如下: (1)、设x={a1, a2, a3, ...}为一个待分类项,而a1, a2, a3...分别为x的特征 (2)、有类别集合C={y1, y2, y3, . 阅读全文
posted @ 2017-07-25 23:01 debuggor 阅读(2250) 评论(0) 推荐(0) 编辑
摘要: Scikit-Learn(决策树)可以用于方法分类和回归。 一、分类 sklearn.tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=2, min_sam 阅读全文
posted @ 2017-07-25 18:57 debuggor 阅读(2142) 评论(0) 推荐(0) 编辑
摘要: 决策树c4.5算法是在决策树ID3上面演变而来。 在ID3中: 信息增益 按属性A划分数据集S的信息增益Gain(S,A)为样本集S的熵减去按属性A划分S后的样本子集的熵,即 在此基础上,C4.5计算如下: 分裂信息 利用引入属性的分裂信息来调节信息增益 信息增益率 信息增益率将分裂信息作为分母,属 阅读全文
posted @ 2017-07-25 15:44 debuggor 阅读(1456) 评论(0) 推荐(0) 编辑