摘要: 朴素贝叶斯中的朴素一词的来源是假设各特征之间相互独立。这一假设使得朴素贝叶斯算法变得简单,但有时会牺牲一定的分类准确率。朴素贝叶斯经常会用于文本分类,它的思想是基于条件概率和联合概率: 条件概率:事件A在另外一个事件B已经发生的条件下发生的概率 记作:P(A|B)特性:P(A1,A2|B) = P( 阅读全文
posted @ 2019-05-22 16:39 HarvardFly 阅读(293) 评论(0) 推荐(0) 编辑
摘要: K-近邻算法又称KNN算法,最早是由Cover和Hart提出的一种分类算法,其原理非常简单,主要是根据计算两个样本之间的距离从而对样本进行预测分类,常用的距离计算公式有欧氏距离: 根据未知样本与已知样本的欧式距离,计算出距离最近的样本,则其为预测样本的类别 在Python的sklearn中使用KNN 阅读全文
posted @ 2019-05-22 16:10 HarvardFly 阅读(471) 评论(0) 推荐(0) 编辑