实训第六天2022/7/16
9:00-10:00 -29
方法:先假设之后修改
10:00-11:00 -30
直方图hist()
11:00-12:00 -31
朴素贝叶斯
朴素:设每个输入变量是独立的。
独立可以分拆
例子:垃圾邮件分类
数据标注
14:00-15:00 -32
词表中包括关键词、词频,根据给出邮件的关键词用公式计算概率
15:00-16:00 -33
朴素贝叶斯sklearn提供三种:
连续值:高斯分布 .GaussianNB()
多元离散值:多项式分布 .MultinomialNB()
二元离散值或稀疏的多元离散值:伯努利分布 .BernoulliNB()
极大似然估计
K近邻KNN
KNN算法:监督学习、无监督学习