2018 年 11月 5 日随笔档案 - 王竹笙

2018年11月5日

摘要： CrawlSpider CrawlSpider 提问：如果想要通过爬虫程序去爬取”糗百“全站数据新闻数据的话，有几种实现方法？方法一：基于 Scrapy框架中的 Spider的递归爬取进行实现（Request模块递归回调parse方法）。方法二：基于 CrawlSpider的自动爬取进行实现（更阅读全文

posted @ 2018-11-05 09:40 王竹笙阅读(1183) 评论(0) 推荐(0) 编辑

2----scrapy框架之代理and日志级和请求传参

摘要：一、代理爬虫文件 daili.py middlewares.py 开启中间件 settings.py557行 scrapy crawl daili --nolog 会保存daili.html 在刘拉你打输入ip显示美国的ip 二、Scrapy的日志等级在使用scrapy crawl spider 阅读全文

posted @ 2018-11-05 09:20 王竹笙阅读(218) 评论(0) 推荐(0) 编辑

王竹笙

纵浪大化中，不喜亦不忧，应尽便须尽，无复独多虑。

公告