摘要: 命令: spider.py 用hashlib来制作哈希值来放在Redis中, 可以减少放在Redis中的为了校验是否存在的内容 spider.py settings.py pipelines.py 阅读全文
posted @ 2019-03-05 23:30 NachoLau 阅读(1128) 评论(0) 推荐(0) 编辑
摘要: crawlspider 命令 spider.py scrapy-redis命令 运行命令: 流程 D:\program files\redis配置文件的配置: spider2.py setttings.py items.py 阅读全文
posted @ 2019-03-05 19:18 NachoLau 阅读(537) 评论(0) 推荐(0) 编辑
摘要: myspider.py middlewares.py 在中间件判断是否需要使用selenium来爬取内容的版本 阅读全文
posted @ 2019-03-05 00:05 NachoLau 阅读(964) 评论(0) 推荐(0) 编辑