热词统计——后端流程分析

后端流程分析

整体的后端流程设计如下

首先是论文的爬取

本系统的主体是论文的一个展示和论文的信息分析

其中论文的爬取工作就是一个关键

论文的爬取选择的pdf文件爬取

pdf文件爬取之后进行文档格式转换

然后对txt文件进行论文文本的操作

其中包括

论文的字段截取

论文的词频统计

论文的主要词汇词云图生成

论文的信息对比

posted @ 2021-05-28 21:30  帅超007  阅读(65)  评论(0编辑  收藏  举报