摘要: #今日目标 **scrapy之盗墓笔记三级页面爬取** 今天要爬取的是盗墓笔记小说,由分析该小说的主要内容在三级页面里,故需要我们 一一解析 *代码实现* daomu.py ``` import scrapy from ..items import DaomuItem class DaomuSpider(scrapy.Spider): name = 'daomu' a... 阅读全文
posted @ 2019-08-04 21:10 Dragon、 阅读(844) 评论(5) 推荐(0) 编辑
摘要: #今日目标 **scrapy之360图片爬取** 今天要爬取的是360美女图片,首先分析页面得知网页是动态加载,故需要先找到网页链接规律, 然后调用ImagesPipeline类实现图片爬取 *代码实现* so.py ``` # -*- coding: utf-8 -*- import scrapy import json from ..items import SoItem clas... 阅读全文
posted @ 2019-08-04 21:00 Dragon、 阅读(315) 评论(0) 推荐(0) 编辑