Spider & CrawlSpider

CrawlSpide 最重要的是分析源码
官方文档百度收搜
Spider document 就是官方文档了1.3的
源码分析
CrawlSpide 是爬取一个网站常用的规则它是对spider进一步的包装继承与spider
里面有一个很重要的类叫做rules 实际上是可迭代的实际上是为了抽取信息用的
Spider

posted @ 2019-05-04 10:01 后山人阅读(251) 评论(0) 收藏举报