上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 24 下一页
摘要: 需要分类的新闻文本存储在数据库中,因此需要读取数据库中的文本数据, 然后再进行分类操作,再把结果存储在数据库中。 阅读全文
posted @ 2021-05-07 17:19 小萌新一枚lll 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 今天实现训练集的预处理 /*** 训练集管理器*/ public class TrainingDataManager { private String[] traningFileClassifications;//训练语料分类集合 private File traningTextDir;//训练语料 阅读全文
posted @ 2021-05-06 17:40 小萌新一枚lll 阅读(22) 评论(0) 推荐(0) 编辑
摘要: 搜集完训练集后还需要对训练集的数据进行处理, 以方便分类时运行的效率更高,今天对需要对训练集进行的处理进行了了解。 阅读全文
posted @ 2021-05-05 13:46 小萌新一枚lll 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 今天的任务是搜集文本分类的训练集,然而网上每个新闻写在不同文本文档的资源很少, 自己动手将excel中的新闻文本内容每一行生成一个txt文档, 成功解决了训练集的问题。 阅读全文
posted @ 2021-05-04 14:36 小萌新一枚lll 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 在对结巴分词进行了了解和安装配置后,今天实现了结巴分词对中文文本的分词 package shunxu; import java.io.IOException; import jeasy.analysis.MMAnalyzer; /*** 中文分词器*/public class ChineseSpli 阅读全文
posted @ 2021-05-03 21:19 小萌新一枚lll 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 在昨天对朴素贝叶斯算法的学习中,知道了基于朴素贝叶斯算法的文本分类器的第一步是实现中文文本的分词 今天对中文分词进行了解 知道了结巴分词这个中文分词工具 结巴分词的特点: 特点 支持四种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析; 全模式,把句子中所有的可以成词的词语都扫描出来, 速 阅读全文
posted @ 2021-05-02 17:26 小萌新一枚lll 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 今天对新闻文本分类所需的朴素贝叶斯算法进行了解和学习 贝叶斯原理 1.1 贝叶斯公式[1] 已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。这里先解释什么是条件概率: 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。 阅读全文
posted @ 2021-05-01 16:10 小萌新一枚lll 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 队名:起名好难队。 队内成员3名 李兴宇(队长):调动组员,分派任务。 赵浩博(队员):技术担当,代码能力强。面对困难不会退缩,虽然嘴上说着退堂鼓的话但是行动上绝不会消极。在学习紧张的时候可以放弃娱乐时间用来学习。 程海翔(队员):技术担当二号。 项目简介:我们做的项目来自于中国软件杯的赛题——新闻 阅读全文
posted @ 2021-03-30 19:21 小萌新一枚lll 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 《构建之法》是一本全景式图书,让我更了解这个行业,是一本与现实接轨的教材。其次,这是一本最佳实践式的书,涵盖了科学、健康的软件工程开展中的每个方面,介绍了种种方法论,但不是高高在上、纲领性的方法论,而是方法论的最佳实践,确实可用,拿来就用。这本书在介绍方法论的同时,会介绍方法论不适用的场景,介绍方法 阅读全文
posted @ 2021-02-28 15:35 小萌新一枚lll 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 本周学习了Android的帧布局,并且继续阅读了《构建之法》这本书, 我从中收获了很多! 阅读全文
posted @ 2021-02-27 18:29 小萌新一枚lll 阅读(20) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 24 下一页