摘要: 功能要求为:1,数据采集,定期从网络中爬取信息领域的相关热词 2,数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成自动分类计数生成信息领域热词目录。 3,热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科) 4,热词引用:并对近期引用热词的文章或新闻进行标记,生成超链接目录, 阅读全文
posted @ 2020-02-10 23:00 小神龙1258 阅读(364) 评论(0) 推荐(0) 编辑
摘要: 直接上代码: import jieba import pandas as pd import re from collections import Counter if __name__=='__main__': filehandle = open("news.txt", "r",encoding= 阅读全文
posted @ 2020-02-10 01:17 小神龙1258 阅读(665) 评论(0) 推荐(0) 编辑