如果汉语背后没有文化,文化背后没有思想,思想背后没有精神,光TMD编造老娘和乔布斯没有说过的话,那中国永远不会是一个伟大的国家。——撒切尔夫人

2021—2022学年第一学期寒假学习记录20

2022.01.20,今天是服务外包竞赛:随便拿个奖队的项目进行的第二十天,今天根据项目要求继续学习matlab数字图像处理

 

训练集文本:

数据样例选用Sogou实验室的文本分类数据的mini版本

 

类别及标号

 

测试数据文本:

 

 

通过观察可知,该文本预期为IT类文章

 

一、 实验结果

运行结果如下图

 

根据数据集的分类编号可知,该测试文本属于IT,与预期相符

五、遇到的困难及解决方法、心得体会

通过此次实验,让我对朴素贝叶斯有了更深刻的理解,原本只是了解基本的先验概率公式。实验过程中学习了中文的分词以及停用词的使用,使分类更加的准确,也认识到了贝叶斯广阔的实用空间,对于机器学习这门课的兴趣也更加浓厚。

posted @   崤函隳  阅读(30)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示