上一页 1 ··· 25 26 27 28 29 30 31 32 33 ··· 96 下一页
摘要: # -*- coding: utf-8 -*-# Define here the models for your spider middleware## See documentation in:# https://docs.scrapy.org/en/latest/topics/spider-mi 阅读全文
posted @ 2020-03-07 01:27 干it的小张 阅读(201) 评论(0) 推荐(0) 编辑
摘要: movie.py虫子 # -*- coding: utf-8 -*-import scrapyfrom moviePro1.items import Moviepro1Itemclass MovieSpider(scrapy.Spider): name = 'movie' # allowed_dom 阅读全文
posted @ 2020-03-07 01:25 干it的小张 阅读(7259) 评论(0) 推荐(0) 编辑
摘要: 创建项目: scrapy startproject wangyi 创建虫子: scrapy genspider wangyi www.xxx.com :创建爬虫文件 执行:scrapy crawl spiderName wangyi.py 虫子 # -*- coding: utf-8 -*-impo 阅读全文
posted @ 2020-03-07 01:22 干it的小张 阅读(405) 评论(0) 推荐(0) 编辑
摘要: - 管道的持久化存储: - 数据解析(爬虫类) - 将解析的数据封装到item类型的对象中(爬虫类) - 将item提交给管道:yield item(爬虫类) - 在官大类的process_item中接收item对象并且进行任意形式的持久化存储操作(管道类) - 在配置文件中开启管道 - 细节: - 阅读全文
posted @ 2020-03-07 01:15 干it的小张 阅读(198) 评论(0) 推荐(0) 编辑
摘要: Scrapy框架的使用 - pySpider- 什么是框架? - 就是一个具有很强通用性且集成了很多功能的项目模板(可以被应用在各种需求中)- scrapy集成好的功能: - 高性能的数据解析操作(xpath) - 高性能的数据下载 - 高性能的持久化存储 - 中间件 - 全栈数据爬取操作 - 分布 阅读全文
posted @ 2020-03-06 11:19 干it的小张 阅读(172) 评论(0) 推荐(0) 编辑
上一页 1 ··· 25 26 27 28 29 30 31 32 33 ··· 96 下一页