摘要: 决策树 原理 信息熵 定义:H的专业术语称之为信息熵,单位为比特。 总结:信息和消除不确定性是相联系的 信息增益:决策树的划分依据之一 定义与公式 特征A对训练数据集D的信息增益g(D,A),定义为集合D的信息熵H(D)与特征A给定条件下D的信息条件熵H(D|A)之差,即公式为: 信息增益表示得知特 阅读全文
posted @ 2021-01-22 20:56 MoooJL 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯算法 朴素贝叶斯算法:朴素 + 贝叶斯 朴素:假设特征与特征之间是相互独立 贝叶斯公式 公式应用在文章分类中,公式可以理解为 公式分为三个部分: P(C):每个文档类别的概率(某文档类别数/总文档数量) P(W│C):给定类别下特征(被预测文档中出现的词)的概率 计算方法:P(F1│C)= 阅读全文
posted @ 2021-01-22 15:15 MoooJL 阅读(66) 评论(0) 推荐(0) 编辑