会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小神龙1258
博客园
首页
新随笔
联系
订阅
管理
2020年2月18日
14 得到相关连的热词数据
摘要: 我根据爬取的链接和热词,进行分析,如果两个词或多个词的文章链接相同,且热词名字不同,那么就爬取对应文章的 内容,根据内容进行分词,得到两个词或多个词的词频,若是差别不大,即可认定两词之间的紧密程度高,同时出现的概率大。最后就输出到相关文件中,每行为相关的热词。 代码如下 def dbwords_gu
阅读全文
posted @ 2020-02-18 00:27 小神龙1258
阅读(311)
评论(0)
推荐(0)
编辑
公告