摘要: 一、完成内容 1、从新闻中提取前沿科技热词,并根据新闻数量来进行热度计算: ①将数量最高的科技热词热度定为100,其余科技种类的热度按照该类型的转换比进行换算并取整。 ②根据前沿科技热词的热度进行级别评定,热度越高的前沿科技热词在界面显示的颜色越深,进行区别。 2、完成对前沿科技热词的增加、删除等管 阅读全文
posted @ 2020-03-13 22:56 我命倾尘 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 一、问题如下 1、要爬取的新闻信息里出现“ ”、“ ”等网页里的空白字符,爬取之后存入数据库时就变为“?”字样。 二、分析过程 1、使用Webmagic爬取内容后,出现了?的字样,尝试使用replace("?","")的方式将?替换为空字符串,但是调试之后并没有解决问题。 2、因 阅读全文
posted @ 2020-03-13 12:53 我命倾尘 阅读(408) 评论(0) 推荐(0) 编辑