2019 级课堂测试试卷-基于中文新闻分词绘制词云图

石家庄铁道大学 2021 年秋季

2019 级课堂测试试卷-基于中文新闻分词绘制词云图

课程名称: 大型数据库应用技术 任课教师: 王建民 测试时间:150 分钟

一、 测试内容:基于中文新闻分词绘制词云图

http://www.idatascience.cn/case-detail?experimentId=38)

1、数据导入展示:

将所有类别的新闻导入数据库中。以树形目录形式展示新闻类别,每个树形节点代表

新闻分类,括号中代表该类新闻的数量,选择每个新闻,以列表形式显示新闻标题,点击新

闻标题,可以查看详细信息。

(参考样式) 2 共 3

 

 

 

 

这是做出来的效果

首先把数据导入到mysql

 

 

 

分别从不同的数据表中找到数据,然后进行展示

点击连接就可以查看文章的内容

 

 

 

2、文章统计:

统计各个类别的文章总数,以柱状图表示。

 

 

 

3、文章分词:

使用中文分词算法解析所有新闻正文,并统计每个词语出现的数量,并以词云图的方

 

 

 

这里分词统计出热词和他相应的数量

式展示,点击词云图中该词语,显示其数量。 3 共 3

4、选择某一类文章,绘制该类型新闻文章词云图,例如汽车类新闻词云图。

 

 

 

 

二、

测试报告:

1、按照测试题目顺序,将实验步骤说明和结果截图存储到答题纸上,文件名以班级学号

姓名词云图命名。

 

posted @ 2021-11-28 22:21  10304  阅读(110)  评论(0编辑  收藏  举报