摘要: CrawlSpider类爬虫中: rules用于定义提取URl地址规则,元祖数据有顺序 #LinkExtractor 连接提取器,提取url地址 #callback 提取出来的url地址的response会交给callback处理 #follow 当前url地址的响应是否重新经过rules进行提取u 阅读全文
posted @ 2018-12-30 16:44 飘在天上的云 阅读(354) 评论(0) 推荐(0) 编辑