会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
hahaxzy
欢迎各位指教,共同进步
博客园
首页
新随笔
联系
管理
订阅
2017年6月5日
朴素贝叶斯文本分类-在《红楼梦》作者鉴别的应用上(python实现)
摘要: 朴素贝叶斯算法简单、高效。接下来我们来介绍其如何应用在《红楼梦》作者的鉴别上。 第一步,当然是先得有文本数据,我在网上随便下载了一个txt(当时急着交初稿。。。)。分类肯定是要一个回合一个回合的分,所以我们拿到文本数据后,先进行回合划分。然后就是去标点符号、分词,做词频统计。 文本分类我个人感觉最重
阅读全文
posted @ 2017-06-05 17:04 hahaxzy
阅读(3820)
评论(2)
推荐(0)
编辑
公告