2018年3月7日

爬虫实践2

摘要: 在前一篇博客中,爬了谣言百科中baby类的百科,现在要同时爬所有类别的百科时应该怎么做呢? 无非是添加一个网址list,和一个类别名list,然后进行遍历爬取数据即可! 上代码: 当然,自己应提前建好类别的文件夹,如图: 然后运行即可得到数据! 阅读全文

posted @ 2018-03-07 17:23 baorant 阅读(246) 评论(0) 推荐(0) 编辑

爬虫实践1

摘要: 1、开发环境: Anaconda3; python 3.6.4; 爬虫部分 使用Requests处理http,post请求。Beautiful Soup处理HTML页面标签并提取信息。目标网站是谣言百科网站,其实这个实战是我谣言处理系统的一部分,但是现阶段对于谣言处理系统我遇到了问题就是精度提高。现 阅读全文

posted @ 2018-03-07 15:29 baorant 阅读(231) 评论(0) 推荐(0) 编辑

导航