摘要: 我根据爬取的链接和热词,进行分析,如果两个词或多个词的文章链接相同,且热词名字不同,那么就爬取对应文章的 内容,根据内容进行分词,得到两个词或多个词的词频,若是差别不大,即可认定两词之间的紧密程度高,同时出现的概率大。最后就输出到相关文件中,每行为相关的热词。 代码如下 def dbwords_gu 阅读全文
posted @ 2020-02-18 00:27 小神龙1258 阅读(311) 评论(0) 推荐(0) 编辑