摘要: 用了一周的时间总算搞定了,跨过了各种坑,总算调试成功了,记录如下: 1、首先在cmd中用命令行建立douban爬虫项目 scrapy startproject douban 2、我用的是pycharm,导入项目后, 1)在items.py中定义爬取的字段 items.py代码如下: 1 2 3 4 阅读全文
posted @ 2018-01-20 23:27 编城浪子 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 用了一周的时间总算搞定了,跨过了各种坑,总算调试成功了,记录如下: 1、首先在cmd中用命令行建立douban爬虫项目 scrapy startproject douban 2、我用的是pycharm,导入项目后, 1)在items.py中定义爬取的字段 items.py代码如下: 2)在spide 阅读全文
posted @ 2018-01-20 23:23 编城浪子 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 根据系统不同: Windows是python目录下Lib\site-packages\; Linux是/usr/local/lib/python/dist-packages/。 阅读全文
posted @ 2018-01-20 21:08 编城浪子 阅读(97) 评论(0) 推荐(0) 编辑
摘要: '''要启用spider中间件,您可以将其加入到 SPIDER_MIDDLEWARES 设置中。 该设置是一个字典,键位中间件的路径,值为中间件的顺序(order)。如上是禁用''' DOWNLOADER_MIDDLEWARES 设置会与Scrapy定义的 DOWNLOADER_MIDDLEWARE 阅读全文
posted @ 2018-01-20 18:54 编城浪子 阅读(453) 评论(0) 推荐(0) 编辑