随笔分类 -  scrapy

三、scrapy后续
摘要:CrawlSpiders 通过下面的命令可以快速创建 CrawlSpider模板 的代码: 我们通过正则表达式,制作了新的url作为Request请求参数,现在我们可以用这个... class scrapy.spiders.CrawlSpider 它是Spider的派生类,Spider类的设计原则是 阅读全文

posted @ 2018-02-27 21:29 酱紫安 阅读(324) 评论(0) 推荐(0)

二、Item Pipeline和Spider-----基于scrapy取校花网的信息
摘要:Item Pipeline 当Item在Spider中被收集之后,它将会被传递到Item Pipeline,这些Item Pipeline组件按定义的顺序处理Item。 每个Item Pipeline都是实现了简单方法的Python类,比如决定此Item是丢弃而存储。以下是item pipeline 阅读全文

posted @ 2018-02-27 16:56 酱紫安 阅读(426) 评论(0) 推荐(0)

一、scrapy的下载安装---Windows(安装软件太让我伤心了)
摘要:写博客就和笔记一样真的很有用,你可以随时的翻阅。爬虫的爬虫原理与数据抓取、非结构化与结构化数据提取、动态HTML处理和简单的图像识别已经学完,就差整理博客了 开始学习scrapy了,所以重新建了个分类。 scrapy的下载到安装,再到能够成功运行就耗费了我三个小时的时间,为了防止以后忘记,记录一下。 阅读全文

posted @ 2018-02-23 17:12 酱紫安 阅读(14953) 评论(2) 推荐(2)

导航