会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
HOLD
模式识别,图像处理,机器学习
博客园
首页
新随笔
联系
订阅
管理
2016年8月12日
基于naive bayes文本分类的spark实现
摘要: 文本分类有很多种方法,朴素贝叶斯应该算是里面最容易的一种了吧。这篇文章简单介绍朴素贝叶斯的原理,然后是spark上的实现方法。 1,问题描述 现实中可能会一些问题,比如一个邮件是不是垃圾邮件?一个新闻是属于社会类还是科技类还是娱乐类?这些问题都可以抽象成:给定一些已经分类好的样本集合{(di,yi)
阅读全文
posted @ 2016-08-12 10:22 HOLD
阅读(608)
评论(0)
推荐(0)
编辑
公告