摘要: 今天做的主要是整合下团队的项目,得到暂时性的成果,发现了很多不足,后续还会改进 import android.util.Log; import java.io.ByteArrayOutputStream; import java.io.DataOutputStream; import java.io 阅读全文
posted @ 2020-04-28 20:54 17_Xtreme 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 知网的数据,可以看到,只需要在左侧选择相关专业或者学科,右面就会对应查询出热门主题排行,这里获取整个表格的前一百行,需要的是除索引外前两列数据。主要是对第一列的数据进行相似度分析以及词频统计。获取到html数据后,使用beautifulsoup进行数据的提取,可以看到主题中是用分号进行短语分割的,首 阅读全文
posted @ 2020-04-28 14:00 17_Xtreme 阅读(361) 评论(0) 推荐(0) 编辑