摘要: 决策树分类 1,概念 2,决策树算法 2.1,特征选择: 熵:值越大,不确定性因素越大;条件熵:即已知x存在的情况下求y的不确定性(越小越好);信息增益(互信息):熵减去条件熵(度量了X在知道Y以后不确定性减少程度),越大越好; 2.2,决策树生成算法 1,ID3算法 2,c4.5算法 信息增益率等 阅读全文
posted @ 2017-09-02 21:59 DamonDr 阅读(1157) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯分类 1,基本概念 2,算法流程 关键点:理解先验概率,条件概率,最大后验概率,下面是以极大似然估计的 3,算法改进(贝叶斯估计) 上述用极大似然估计可能会出现所要估计的概率值为0的情况,改进方法: 先验概率贝叶斯估计:K表示类别数,λ为参数:0时为极大似然估计;1时为拉普拉斯平滑 条件概 阅读全文
posted @ 2017-09-02 19:51 DamonDr 阅读(574) 评论(0) 推荐(0) 编辑