常见机器学习方法的优缺点及适用场景：朴素贝叶斯

朴素贝叶斯（Naive Bayes）

　　特点：基于贝叶斯定义和特征条件(属性)独立假设的分类器方法

　　优点：模型所需估计的参数很少，对缺失数据不太敏感，算法也比较简单，具有很好的模型的可解释性。朴素贝叶斯模型与其他分类方法相比具有最小的理论误差率。

　　缺点：属性之间相互独立，这个假设在实际应用中往往是不成立的，在属性个数比较多或者属性之间相关性较大时，分类效果不好。

　　应用：朴素贝叶斯算法一般应用在文本分类，垃圾邮件的分类，信用评估，钓鱼网站检测等。

　　模型：

当涉及到多个条件时，朴素贝叶斯有一个提前的假设，我们称之为条件独立性假设（或者简单假设：Naive），公式如下：

而对这里来说，假设

为了选择后验概率最大的结果，进行概率的比较，由于分母一致，这里直接去掉分母，得到最后的计算公式：

　　改进：属性直接完全独立的条件太强，对于这一点，有半朴素贝叶斯之类的算法通过考虑部分关联性适度改进，例如为了计算量不至于太大，我们假定每个属性只依赖另外的一个属性。解决特征之间的相关性，我们还可以使用数据降维(PCA)的方法，去除特征相关性，再进行朴素贝叶斯计算。

sklearn库：

# 连续属性
from sklearn.naive_bayes import GaussianNB
# 离散属性
from sklearn.naive_bayes import CategoricalNB

posted @ 2022-04-17 17:39 Gentle_Jan 阅读(1115) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 常见机器学习方法的优缺点及适用场景：支持向量机（SVM）

· 常见机器学习方法的优缺点及适用场景：K近邻（KNN）

· 常用ML算法

· 机器学习之朴素贝叶斯

· 机器学习machine learning

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

公告

昵称： Gentle_Jan
园龄： 2年11个月
粉丝： 0
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

Gentle · Jan

常见机器学习方法的优缺点及适用场景：朴素贝叶斯

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜