会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
野野
博客园
首页
新随笔
联系
管理
订阅
2018年2月8日
学期总结(一)------文献挖掘
摘要: 我负责的主要部分是文本的分类,运用最基础的朴素贝叶斯分类算法进行处理数据。 一、数据源 采用22673篇文档的数据集,其中的0.7作为训练集,其中的0.3当做测试集来计算roc,测试集一共有6802篇文章的题目和摘要。 二、数据预处理 原始数据是一个TXT中有很多篇文章,包括他的各种属性,我们只把需
阅读全文
posted @ 2018-02-08 20:43 野野
阅读(248)
评论(0)
推荐(0)
编辑